はじめに
こんにちは マネージドサービス部の福田です。
先日、Amazon CloudWatchに生成AIを活用した新しい調査機能が追加されました。
ちなみに私はAWS Summit Japan 2025 1日目(6/25)に現地参加した際のAWS Villageにてこの機能知りました
正式には「Amazon Q Developer Operational Investigations」のことだと思われます
本記事では、この新機能の概要から概要レベルで設定の流れについてご紹介します。
機能概要
この機能は、生成AIによりCloudWatch上の情報(メトリクス、ログ、トレースなど)を分析し、システム異常の根本原因や影響、そして推奨される対応策を自然言語で提示してくれる機能になります。
これまで人が行っていた複数のグラフの比較やログの調査といった初動対応を、AIが代行してくれるイメージです。
実際の使用イメージ
「AIオペレーション」項目の選択
CloudWatchのコンソール画面を開くと、左側のナビゲーションペインに「AIオペレーション」という新しい項目が追加されています。
ここをクリックしてセットアップを開始します。
初期セットアップと調査グループの作成
セットアップ画面では、「調査グループ」という単位で設定を行い、AIの分析結果の保持期間や、分析に必要なIAMロールなどを設定します。
※ デフォルトで作成されるIAMポリシーは、リソースの読み取り権限に特化しており、設定変更やリソース削除といった書き込み権限は含まれていませんでした。
セットアップ完了
設定が完了すると、機能が利用可能な状態になります。
調査の作成と実行
セットアップが完了したら、実際にAIによる分析を実施します
「調査」の作成
AIに分析してほしい内容を「調査」として作成します。今回は、特定のメトリクスのみを分析対象として指定してみます。
分析対象メトリクスの選択
分析したいメトリクスを選択し、新しい「調査」を作成します。
分析開始
「調査」が作成されると、AIによる分析が自動的に開始されます。分析が完了するまでには少し時間がかかるため、10分ほど待ってから結果を確認するのがおすすめです。
分析結果の確認
調査が完了すると、「調査」の一覧画面から結果を確認できます。
分析結果は、画面右側の「提案」欄にカード形式で表示されます。
内容を確認し、「承諾」または「破棄」を選択できます。承諾した情報はフィード欄に表示される形となります
推奨アクションの提示
インシデントに対する具体的な推奨アクションが提示されます。
仮説推論の提示
AIがなぜそのように判断したのか、判断元の情報も示されます。
分析結果の精度について
今回は、簡単な検証作業中に負荷がかかったElastiCacheのメトリクスを分析対象としました。
結果として提示された内容は、実際の状況をまあまあ正確に捉えているという印象を受けました。
通知について
分析結果は、Amazon SNSとAWS Chatbotを経由して、Slackなどのチャットツールに通知することも可能です。
まとめ
本記事では、Amazon CloudWatchに新しく追加された生成AI活用機能について、セットアップから実際の分析結果までをご紹介しました
複数メトリクスの相関分析やログの確認といった作業をAIが代行し、自然言語で状況を要約してくれるのはいい機能ですね。
この機能によって、インシデント解決までの時間が短縮されていくのではないかと思っております。
・福田 圭(記事一覧)
・マネージドサービス部 所属・X(Twitter):@soundsoon25
2023 New Relic Partner Trailblazer。New Relic Trailblazer of the Year 2025受賞。New Relic User Group運営。