Amazon Connectのコンタクトフローで利用する音声として、サードパーティWEBサービスを利用し、動的に連携する仕組みを検証してみました。実際の動作を動画としてもご覧いただけます。
概要
Amazon Connect の2022年4月のアップデートで、コンタクトフロー内で再生する音声プロンプトとして、S3に格納した音声ファイルを指定することが可能になりました。
リリースされた際に「サードパーティ製音声を動的に利用できそう」というアイデアはありましたが、株式会社エーアイ様のAITalk® WebAPIをトライアルさせていただき、検証してみました。
構成
まず、Amazon ConnectコンタクトフローからLambdaを呼び出し、AITalk WebAPIをコールします。
音声合成された結果がレスポンスされますので、S3へアップロードします。
アップロードされたS3パスをAmazon Connect側へ返し、コンタクトフロー側ではS3パスを指定し、プロンプト再生します。
これで動的に合成された音声プロンプトを再生することができます。
動作デモ
動作の様子を動画にしました。応答レスポンスなどを含めた動作イメージがご確認いただけます。
デモに使用した音声合成機能、音声データは株式会社エーアイ様の「AITalk® WebAPI」をトライアルを利用させて頂きました。下記リンクをご参照ください。
株式会社エーアイ様: https://www.ai-j.jp/
AITalk® WebAPI: https://www.ai-j.jp/products/cloud_webapi/
最後に
Amazon ConnectではAmazon Pollyベースの音声読み上げ機能が統合・利用可能となっており、それを使用するのが最もシンプルになります。
ただし、企業のイメージや発声ニュアンスの調整など、どうしても別の音声合成サービスを利用するケースは考えられます。
今回のような仕組みを組み込むことで、サードパーティサービスを利用した動的な音声合成にも対応することが可能になります。
お客様のお名前や指示内容の復唱など、対応範囲が拡がるのではないでしょうか。
ご参考になれば幸いです。