Contact Lens にカスタム語彙が登録できるようになりました

記事タイトルとURLをコピーする

こんにちは。Amazon Connect専任担当の丸山です。
Contact Lens for Amazon Connectが期待してたよりも早くカスタム語彙に対応しました。
これはちょっとうれしい想定外のできごとです。

前提1:Contact Lens とは

Contact Lens にカスタム語彙が適用できるようになったんだよ!と言いたいのですが、え?コンタクトレンズ?AWSが視力矯正まではじめたの?という誤解も与えかねないのでまずは「それなに?」からご説明します。

Amazon Connectはクラウド型のコンタクトセンターサービスです。
AWSマネジメントコンソールでポチポチするだけでコールセンターのシステムが作れます。

そんなAmazon Connectには付加サービスが用意されています。
その一つがContact Lens for Amazon Connectです。

Contact Lens for Amazon Connectとは、機械学習を活用したコンタクトセンター分析です。
Amazon Transcribeで会話をテキスト化して、会話の内容を分析してくれてる今どきなサービスです。
もっと詳しくしりたいという方は動画でご説明をしているのでそちらを御覧ください。

youtu.be

このContact Lens for Amazon Connectの弱点がテキスト化のエンジンのカスタマイズができないことでした。
サーバーワークスとなんど言っても「鯖ワックス」と認識します。
会社名くらい、覚えてほしいのに。

f:id:swx-maruyama:20220203115155p:plain

前提2:カスタム語彙とは

Amazon Transcribeは音声をテキストに変換する機能です。
日本語のテキスト化って難しいんでしょ、とお思いの方も多いと思います。
そうなんです。超難しいのです。
しかしそこはAWS。学習を深めてかなりいい感じにテキスト化できるように成長しています。
わたしたちサーバーワークスが社内で使い始めた2年前に比べて驚くほど精度がよくなっています。

しかしAWSが汎用的なテキスト化の学習を深めることをしてくれても、利用者独自の学習をすることができません。
Speech To Textのエンジンはどのように学習させていくかも大切なポイントです。

そこでAmazon Transcribeでは「カスタム語彙」という機能が用意されています。
カスタム語彙、しっくりきます?わたしはしっくりきません。
英語表記だと「Custom Vocabularies」です。こちらのほうがむしろすんなりわかりやすい気がします。

鯖ワックス→サーバーワークス
という定義をつくってあげれば、サーバーワークスというただしいテキスト化ができるようになります。

できるようになったこと

そこで、本題に戻るのですが、Contact Lens for Amazon Connectでカスタム語彙の利用ができるようになったんです。
Contact Lens for Amazon Connectが、弱点であったテキスト化のカスタマイズを克服したのです。
どうです?うれしさがつたわりましたか?

設定手順

ドキュメントでは2022-02-03時点でまだ英語版しか提供されておらず、使い方がわかりにくい点もあったのでご説明をさせていただきます。
すでにContact Lens for Amazon Connectの利用設定ができている前提の説明とさせていただきます。

docs.aws.amazon.com

設定をはじめる

カスタム語彙の設定はAmazon Connectの管理画面内「メトリクスおよび品質」のメニューから行います。
f:id:swx-maruyama:20220203114234p:plain

現時点ではメニュー名は「Custom Vocabularies」となっています。
画面を開くとタイトルは「Contact Lens のカスタム語彙」です。
この画面でカスタム語彙設定、管理を行います。

f:id:swx-maruyama:20220203114301p:plain

カスタム語彙のファイルを作成する

画面から直接カスタム語彙を登録、編集、削除することはできません。
事前に作成した「カスタム語彙ファイル」(テキストファイル)を登録する利用方法となります。
カスタム語彙ファイルの作成方法はAmazon Transcribeのマニュアルを確認してください。
非常に簡単な例として、鯖ワックス→サーバーワークスに変換するファイルを記載します。

Phrase   IPA SoundsLike  DisplayAs
サバワックス          サーバーワークス
鯖ワックス         サーバーワークス

タブ区切りのテキストファイルとなっています。
文字コードはUTF-8です。

カスタム語彙ファイルには制約もありますのでお気をつけください。
運用上特に気になりそうなのが以下になります。

  • テキストファイルのサイズは50KBが上限
  • テキストファイル内のエントリは256文字未満であること

docs.aws.amazon.com

カスタム語彙ファイルを登録する

カスタム語彙ファイルを用意できたら、管理画面から登録をします。
ここからは簡単です。
「カスタム語彙を追加」というボタンをクリックします。

f:id:swx-maruyama:20220203114356p:plain

画面で登録する項目は「名前」「言語」の2つです。
迷いようがない。
ファイルを選択したら「保存してアップロード」をクリックします。
Amazon Connectの管理画面ではオペレーションボタンが画面の上にあったり下にあったりするのですがどこかにあるはずだ。というマインドをもって探していただければと思います。

ボタンをクリックしたら「準備中」というステータスになります。
裏側でTranscribeに反映させているのでしょうか。少し待つと「準備完了」というステータスになります。

カスタム語彙ファイルを適用する

カスタム語彙ファイルを登録して「準備完了」となっても利用されません。
「デフォルトとして設定」をしないと利用されないようです。
言語につき1つデフォルト設定ができます。

f:id:swx-maruyama:20220203114448p:plain

これで設定は完了です。
鯖ワックスの呪いから開放されるのです。

f:id:swx-maruyama:20220203115254p:plain

カスタム語彙ファイルの設定 豆知識

カスタム語彙ファイルを編集したい場合は、
ダウンロード→ファイル編集→アップロード(カスタム語彙を追加)→デフォルト設定変更
という手順を踏むことになります。

削除ですが、デフォルトとして設定されている間は削除ができません。
削除をしても「削除中」ステータスとなりすぐには削除されません。
ドキュメント上では削除に90分程度かかるそうです。
わたしの環境では20時間くらい経過したのですがまだ削除中となっていてのんびりしているご様子です。

カスタム語彙ファイルの適用 豆知識

カスタム語彙ファイルのデフォルト設定をしたら以降のContact Lens分析で自動的に利用されます。
過去のテキスト化の内容は変更されません。

運用イメージ

  1. まずは素のContact Lensを利用して、商品名や会社名や業界用語などよくご認識されるワードの誤変換リストを作成する
  2. カスタム語彙ファイルを作成して有効化する
  3. カスタム語彙が効力を発揮しているか確認し、できていない場合はカスタム語彙ファイルを調整する
  4. 定期的に誤変換リストをアップデートし、カスタム語彙ファイルをメンテナンスしていく

少しずつ、自分たちになじませていく地道な運用となります。
カスタム語彙ファイルは制約があるため、登録できる言葉に限りがあります。
わりと厳選させていく必要があるのかな、と思っています。

まとめ

実装がまだ荒削りな部分も正直感じるのですが、カスタム語彙でテキスト化のコントロールができるようになったのは大変うれしいことです。
Contact Lens for Amazon Connectの利用をよりおすすめしやすくなりました。

最後に料金についてご案内します。
カスタム語彙の利用は無料です。
ただしContact Lens for Amazon Connectは従量課金のサービスです。
Amazon Connectの月額利用料金試算ツールをサーバーワークでは提供しています。
このツールのでContact Lens for Amazon Connectを有効にした場合、使わなかった場合の試算もできるようになっています。
簡易的な試算となりますが導入の参考にしていただけますと幸いです。

Amazon Connect コスト試算

Contact Lens for Amazon Connectは試用してみてご利益を感じなければ利用を停止することも簡単にできます。
ぜひ一度機能を実際に体感いただければと思います。

丸山 麻衣子(記事一覧)

Amazon Connect 専任担当
Amazon Connect の情報をお探しの方はこちらもどうぞ