【re:Invent2017】Amazon Comprehendについて整理してみた

AWS運用自動化サービス「Cloud Automator」
この記事は1年以上前に書かれたものです。
内容が古い可能性がありますのでご注意ください。

こんにちは、re:Invent参加中の多田です。

Andy Jassy氏のキーノートで発表された「Amazon Comprehend」ですが、どんなサービスなのかを整理してみたいと思います。
なお、サービス発表時の公式ブログはこちらです。

Amazon Comprehendとは

Amazon Comprehend(以下、Comprehend)とは、自然言語処理を行うためのサービスになります。
例えば、ブログで使っている文字情報や普段の話言葉などを自然言語と言います。普段の話す言葉からキーワードの情報や感情を分析していくための手法です。
現状対応している言語は、英語とスペイン語のみです。

利用できるリージョンは、現時点では以下のリージョンになります。

  • バージニア
  • アイルランド
  • オレゴン
  • オハイオ

どんな利用シーンがあるか

Comprehendはどんな利用シーンがあるでしょうか?
ドキュメントには以下のような例が挙げられていました。

  • ケース 1:  Comprehendのトピックモデリングを使って特定のテーマに関するドキュメントを検索します。
  • ケース 2:  例えば製品のカタログを出している場合、その中身の情報から顧客がどのように感じるかを判定するのにComprehendが役立ちます。
  • ケース 3: フォーラムや掲示板で顧客が話しているトピックを発見し、トピックに関連する人物、場所、物を特定します。 分析を用いて、顧客がトピックについてどのように感じているかを判断します。

言葉の情報から他の情報を調べたり、人がどのような感情をもっているかを文字情報から解析するのに役立つということですね。

リリース後のセッション参加レポート

サービスリリース後の「MCL343 – NEW LAUNCH! Natural Language Processing for Data Analytics」というセッションにも参加してきました。

スピーカーの方がおっしゃっていたのが、自然言語処理のニーズは高まっているが、通常、自然言語処理を行おうとすると資金面や実装の敷居が高いが、Comprehendは簡単に自然言語処理を行うことができるということです。
確かに機械学習の注目と相まって自然言語処理のニーズは高まっていると私も感じます。

Comprehendを構成するのは、感情・属性・言語・キーフレーズ・トピックモデリングになります。これらを使って言語処理を行います。

ローンチカスタマーの事例も2社紹介がありました。ニュースの情報を解析するサービスを提供している事例は面白そうでした。

あとは、Twitterの情報を解析するデモを拝見しましたが、身近でとっつきやすそうなので私もトライして、またブログに書きたいです。

Comprehendを使ってみた

実際にComprehendを使ってみました。

英語とスペイン語しか対応がないため海外のエンジニアの方と喋るために考えた自己紹介文を解析してみました。

属性は、地名や名前、会社名がひっかかりました。キーフレーズはたくさんひっかかっています。

感情の部分は、ポジティブな内容にしたつもりだったのでポジティブな要素がもっとも多く判定されていました。

まとめ

新サービスのComprehendについて整理してみました。

早速事例も出ており、デジタル時代において有用なサービスと思うので自分自身が扱えるようになっていく過程をブログにアップしていければと思います。次回はモデリングの作成を行います。

それでは!

 

AWS運用自動化サービス「Cloud Automator」