【アップデート】Amazon Personalizeでデータセットの分析が簡単にできるようになりました

記事タイトルとURLをコピーする

クラウドインテグレーション部の村上です。

2023年1月26日は記念すべき日でしたね!

八村選手、日本人初のレイカーズデビュー&視聴サイトのサーバダウンというバスケ界隈が大いに盛り上がった日でした。

さて、今回はAmazon Personalizeのアップデート内容を紹介します。

aws.amazon.com

Amazon Personalizeとは

Amazon Personalizeとはエンドユーザー向けのレコメンデーションが行えるサービスです。

機械学習の知識がなくとも、ECサイトでのオススメ商品や動画配信サービスでのオススメ動画のレコメンデーションを簡単に実行できる、というものです。

Amazon Personalize利用の流れ

以下のような流れで進みます。

  • Dataset Groups作成
  • Datasetのインポート
  • Solution作成(機械学習モデルのトレーニングに相当)
  • Campaign作成(機械学習モデルのデプロイに相当)

実際の利用の流れは以下のブログをご参照ください。

blog.serverworks.co.jp

アップデートの内容

インポートしたデータセットの分析ができるようになりました。

利用目的

データセットをインポートした後、機械学習モデルのトレーニングに相当するSolution作成を行います。例えば、このときデータに外れ値が多いと、精度に影響が出る場合があります。

この機能では、精度に悪影響を与えるかもしれないデータセットの要素を教えてくれます。

Solutionを作成する前に、気付きを得るための機能と言えます。

利用方法

画像を再掲しますが、画面右上のRun analysisを選択するだけです。

今回使用したデータセット

Amazon PersonalizeのWorkshopで公開されているデータセットを使用しました。

Amazon Personalizeには以下3種類のデータセットがあり、すべてのデータを分析可能です。

  • Interactions
  • Users
  • Items

Insightsで分析結果を確認

分析が完了すると、推奨されるデータセットの修正点が表示されます。

AGEカラムに外れ値があると指摘されていますね。

The following (numerical) column(s) have outliers, which can negatively impact recommendations: [AGE]

カラムごとの統計情報も表示される

任意のカラムを選択すると、平均値や中央値、標準偏差などの統計情報が表示されます。

まとめ

  • Amazon Personalizeでデータセットの分析が使用できるようになりました
  • 分析はデータセットのインポート後に実施可能です
  • Insightsや統計情報を活用することで、精度の高いレコメンデーションに寄与します

AWSのAIサービスでは、「機械学習の知識がなくても使える」というフレーズが枕詞に使われますが、今回のアップデートのように「使いこなせる」機能もどんどん出てきているので引き続きキャッチアップしていきたいです。

村上博哉 (執筆記事の一覧)

2020年4月入社。機械学習が好きです。記事へのご意見など:hiroya.murakami@serverworks.co.jp