Amazon Transcribeを使って自動で文字起こしできるようにする

AWS運用自動化サービス「Cloud Automator」

技術2課の小林です。

最近Transcribeを触る機会がありました。
そのとき、S3にPUTするとTranscribeが自動実行される構成を考えました。

 構成とシナリオ

  1. S3 Bucket音声データ格納用に音声データを格納
  2. 1をトリガーにLambdaが起動し、Transcribeが起動する
  3. 文字起こしの結果がS3 BucketTranscribe結果格納用に格納される

構築手順

1. S3 Bucketの作成(音声データ格納用と Transcribe結果格納用

2, Lambdaの作成

  • IAM Role
    • AmazonS3FullAccess
    • AmazonTranscribeFullAccess
    • CloudWatchLogsFullAccess
  • トリガー
    • 1で作成したS3 Bucket 音声データ格納用を指定
  • 関数コード
    • コード
      • 下記コードを入力
  • 環境変数
    • キー
      • output_bucket
      • S3 BucketTranscribe結果格納用 のBucket名を記入

 

あとがき

作成後、S3 Bucket音声データ格納用 に音声ファイルを格納すると 、Transcribe結果格納用に出力結果のjsonファイルと書き込み確認用のオブジェクト .write_access_check_file.temp が出力されます

この構成単体で使うことは少ないかもしれませんが、これを応用して Transcribe結果格納用 bucketにPUTされたことをトリガーに次の処理を実行する、ということができます(私の場合は、Translateとの連携を実施しました)

色々試してみてください

参考URL

AWS運用自動化サービス「Cloud Automator」