【re:Invent 2025】セッションレポート Build AI your way with Amazon Nova customization (AIM382)

記事タイトルとURLをコピーする

みなさん、こんにちは。AWS CLI が好きな AWS サポート課の市野です。

2025年12月1日からラスベガスで開催されている AWS re:Invent 2025 に現地参加し、「Build AI your way with Amazon Nova customization (AIM382)」のセッションを聴講しました。

Event Catalog での説明

AI delivers the most value when it deeply understands your business. Whether you're enhancing the customer experience of your AI applications, or building agents that handle diverse tasks - Amazon Nova gives you tools to adapt the model to your specific needs. Learn how to combine the power of your organization's data for aligning model responses to your preferred tone and behavior, or training it on your unique workflows and business knowledge. Hear from Terra Security how they incorporated proprietary security data with built-in guardrails, dynamic refusal capabilities, and model retraining to ensure ongoing effectiveness in security operations.
(機械翻訳による和訳)
AIは、お客様のビジネスを深く理解することで最大の価値を発揮します。AIアプリケーションのカスタマーエクスペリエンスを向上させる場合でも、多様なタスクを処理するエージェントを構築する場合でも、Amazon Novaは、お客様固有のニーズに合わせてモデルを適応させるツールを提供します。組織のデータを活用して、モデルの応答を好みのトーンや行動に調整したり、独自のワークフローやビジネス知識に基づいてトレーニングしたりする方法について学びましょう。Terra Securityが、独自のセキュリティデータに組み込みのガードレール、動的な拒否機能、モデルの再トレーニングを統合し、セキュリティ運用の継続的な有効性を確保した方法をご覧ください。

概要

Amazon Nova 2 の各モデルファミリーの概要とそのカスタマイズ戦略について、必要性、具体的な手法や実際の応用事例について解説されていました。

アジェンダ

セッションのアジェンダは以下のとおりです。
() カッコ内は筆者による注釈です

  • Customizing Amazon Nova models(Amazon Novaモデルのカスタマイズ)
  • Customizable content moderation settings(カスタマイズ可能なコンテンツ管理設定)
  • Agentic Al powered continuous penetration testing(Agentic AI による継続的な侵入テスト)

Nova 2 のモデルファミリーの紹介

Matt Garman のキーノートで発表された Amazon Nova 2 のモデルファミリーについて、多様なニーズに応えるために設計された、最先端の基盤モデル群であるとして、以下のように紹介されていました。

  • Amazon Nova 2 Lite
    • エージェントやコード生成のユースケースで優れた性能を発揮する、価格性能比の高いハイブリッド推論モデル
  • Amazon Nova 2 Pro
    • コーディングやエージェントなどの複雑なタスクで性能が向上した、高性能なマルチモーダルモデル
  • Amazon Nova 2 Omni
    • テキスト、画像、動画に加え、音声やスピーチも入力として受け付け、テキストと画像を生成できるマルチモーダル推論モデル
  • Amazon Nova 2 Sonic
    • 音声から音声への変換に特化したモデル

また、投影スライドから転記したものですが、それぞれのモデルでは以下のような能力となっています。
() カッコ内は筆者による注釈です

Amazon Nova 2 Lite Amazon Nova 2 Pro Amazon Nova 2 Omni Amazon Nova 2 Sonic
Availability
(提供)
GA Preview Preview GA
Context window
(コンテキストウィンドウ)
1M 1M 1M 1M
Languages
(対応言語)
200+ languages 200+ languages 200+ languages 7 languages
22 voices
Input Modalities
(入力形式)
Text, Image, Video Text, Image, Video Text, Image, Video,Audio Speech, Text
Output Modalities
(出力形式)
Text Text Text, Image Speech, Text

AI カスタマイズの必要性

Gartner の調査より以下のように予測されており、汎用モデルで広く万能に使おうとするアプローチは、企業の専門的なニーズにはもはや十分ではないと述べていると紹介されました。

"By 2027, more than half of the GenAl models used by enterprises will be domain-specific (specific to an industry or business function), up from 1% in 2024."
(機械翻訳による和訳)
「2027年までに、企業が使用する一般AIモデルの半分以上がドメイン固有(業界またはビジネス機能に固有)となり、2024年の1%から増加するでしょう。」

さらに、今やあらゆる組織が良いモデルにアクセスできる時代で精度だけでは競争力にならないと述べられ、カスタマイズがもたらす具体的な利点として以下のように解説されました。

  • 企業固有の業務プロセスやノウハウをモデルに埋め込むことができる
  • 汎用モデルにはない、企業独自のトーンやスタイルで一貫した応答を生成する
  • 企業の専有データでモデルをグラウンディングさせ、汎用的な回答を排除する
  • 専門分野において、より正確で安全なモデル運用を可能にする
  • 汎用モデルが進化しても追いつけない、企業独自の価値を構築する

Amazon Nova におけるモデルのカスタマイズ手法

Amazon Nova は、目的に応じて選択可能な 4 つの主要なカスタマイズ手法を提供していると紹介されました。

  1. プロンプトエンジニアリング
    • 最もシンプルで手軽な手法
    • モデルの重みを変更せず、プロンプト内でコンテキストを与えることで応答を調整する
  2. 教師ありファインチューニング
    • モデルの重みを変更する、より高度な手法
    • 特定のタスク(要約など)に対して、入出力のデータセットを用いてモデルを訓練し、特化させる
  3. アライメント
    • 人間の好みやモデルからのフィードバックを用いて、モデルの応答を特定のトーンやブランドボイスに沿うように調整する
    • 強化学習などがこのカテゴリに含まれる
  4. 継続的な事前学習
    • モデルが事前学習で見ていないようなニッチなドメインの非構造化データを用いて追加学習を行い、深い専門知識を吸収させる

カスタマイズ実行のためのツールとプログラムについて

これらのカスタマイズを容易に実行するための包括的なツール群として AWS で以下の 4つの製品、アプローチを提供していると紹介されました。

  • Amazon Bedrock
    • マネージドな環境で Amazon Nova をカスタマイズする最も簡単な方法として紹介されました
    • コンソールまたはAPIを通じて、①ソースモデルの選択、②ハイパーパラメータとデータの指定、③カスタマイズジョブの設定、という 3 ステップで実行可能
  • Amazon SageMaker
    • 完全なカスタマイズを行いたいユーザー向けの手法として紹介されています
    • ファインチューニングや継続的な事前学習のための事前構築済み「レシピ」が提供され、インスタンスタイプの選定といった煩雑な作業が自動化されるメリットがあります
    • カスタマイズしたモデルは Amazon Bedrock に持ち込んで推論に利用可能
  • Amazon Nova Forge
    • 今回の re:Invent 2025 で発表された、より深いカスタマイズを行うためのプログラム
    • 事前学習後や再訓練後のモデルチェックポイントへのアクセス、報酬関数の独自定義、知識蒸留、責任あるAIツールキットへのアクセス、プレビュー段階のモデル(Amazon Nova 2 Pro など)への早期アクセスが可能
  • Amazon Bedrock での推論オプション
    • オンデマンド推論
      • トークン単位の従量課金制
    • プロビジョニングされたスループット
      • 本番環境向け。専用の処理能力を確保し、一貫したパフォーマンスを提供する

カスタマイズが必要なシーン・ユースケースについて

ユースケース1:責任ある AI とコンテンツモデレーションのカスタマイズ

LLM(大規模言語モデル)には安全ガードレールが組み込まれているが、これらの標準的なガードレールは、以下のような特定の業界における正当なユースケースを妨げることがある。

  • サイバーセキュリティ
    • テスト用のマルウェアコード生成やサイバー攻撃のシミュレーション
  • 法執行機関・メディア
    • 犯罪、薬物、暴力に関するコンテンツの分析や生成
  • オンラインプラットフォーム
    • 成人向けコンテンツなど、多様なテーマの扱い

Amazon Nova では、これらの正当なユースケースに対応するため、コンテンツモデレーション設定をカスタマイズする機能が提供されている。
これにより、以下の 4 つの次元でコンテンツ生成の許可レベルを調整できる。

次元 対象コンテンツの例
安全性
(Safety)
危険な武器、規制薬物
センシティブコンテンツ
(Sensitive Content)
冒涜的な言葉、いじめ、ヌード、成人向けテーマ
公平性
(Fairness)
バイアス、特定の集団に対するステレオタイプ
セキュリティ
(Security)
マルウェア、フィッシングメール、悪意のあるコード

技術的実装について

カスタマイズは、3 つのコンポーネントの連携によって実現が可能と紹介されました。

  1. コアモデル (LoRAアダプター)
    • モデルの元の重みは変更せず、LoRA(Low-Rank Adaptation) と呼ばれる小さな追加モジュールをモデルの特定レイヤーに適用する
    • これにより、中核的な安全性を維持しつつ、特定の責任ある AI(RAI)次元の制約を「アンラーン(unlearn)」させることが可能になる
  2. ガードレール(出力モデレーション)
    • ユーザーが特定のコンテンツ次元(例:セキュリティ)を許可した場合、出力モデレーションのコンテンツ分類器もそれに合わせて調整され、該当するコンテンツがブロックされなくなる
  3. 利用可能性
    • この機能は Amazon Bedrock 上でカスタムオンデマンドモデルとして提供される
    • API の呼び出し方法は標準モデルと同じで、モデルのARN(Amazon Resource Name)を変更するだけで利用できる

ユースケース2:Tera Security 社におけるエージェント型AIの高度なカスタマイズ

Tera Security 社は、攻撃者が AI を活用して攻撃をスケールさせている現状に対抗するため、防御側も AI を活用する必要があるという思想のもと設立された。
同社は、AI エージェントにハッキング技術を教え込み、従来 90% が手動であったペネトレーションテスト(侵入テスト)を自動化するソリューションを開発している。

ここでの最大の課題は 「ガラドリエルのパラドックス」と呼ばれるもので、「いかにして全ての脆弱性を発見するか(AIの有効性)」と「いかにして本番システムに損害を与えないか(安全性)」 という二律背反を両立させることだった。

多層的なガードレールシステムとその限界

Tera Security 社は当初、以下の多層的なガードレールシステムを構築した。

  1. ベースモデル
    • Amazon Nova 2 Pro(AWSチームと協業し、攻撃ペイロード生成が可能なカスタム設定を適用)
  2. Tera Security 社のハードコードルール
    • 「いかなる環境でもデータベーステーブルを DROP しない」といった絶対的なルール
  3. 顧客ごとのルール
    • 顧客が定義する独自の安全ルール

ただ、上記のシステムでも問題は残ったとのこと。
具体的には、LLM は訓練データで頻繁に見たパターンを生成する傾向があるため、ガードレールを設けても、依然として '; DROP TABLE users; -- のような破壊的なペイロードを生成することがあったとのことでした。

「ディフェンダー」エージェントのファインチューニングするという解決策

前述の問題を解決するため、Tera Security 社は第 2 の防衛ラインとして、攻撃ペイロードの生成を監視・ブロックする専門の「ディフェンダー」エージェントを導入した。
しかし、このディフェンダーは「疑わしきはブロックする」というデフォルトの挙動が強すぎ、安全なペイロードまでブロックしてしまう(偽陽性)という新たな問題を引き起こした。

プロンプトエンジニアリングではこの根本的な挙動を変えられないと判断した Tera Security 社は、ファインチューニングによる解決策を選択した。

データ収集とファインチューニングプロセス

  1. データ収集
    • Tera Security 社のセキュリティリサーチャーが AI エージェントと協働する 「ヒューマン・イン・ザ・ループ」 方式を採用
    • エージェントの判断(ブロック/許可)に対する人間のフィードバックを収集し、高品質なラベル付きデータセットを作成した
  2. データ準備と知識蒸留
    • SageMaker を用いてデータを匿名化し、訓練用とテスト用に分割
    • さらに、より高性能なモデル(教師モデル)を用いてデータに豊富なコンテキストや洞察を付与し、その知識をより小型のモデル Amazon Nova 2 Lite(生徒モデル)に転移させる「知識蒸留(Knowledge Distillation)」を適用
    • これにより、小型・高速・低コストでありながら、高い知識レベルを持つモデルを作成した
  3. ファインチューニングとデプロイ
    • 準備したデータを用いて SageMaker で Amazon Nova 2 Lite をファインチューニング
    • 評価後、完成したカスタムモデルを Amazon Bedrock にデプロイし、オンデマンドで利用可能にした

成果と今後の展望

このアプローチにより、Tera Security 社は自社のビジネスコンテキストをモデルの挙動に直接注入することに成功したとのこと。

成果

ディフェンダーエージェントによる根本原因の特定精度(正しいブロックの割合)が、わずか 1 回の開発サイクルで 80% から 92% へと劇的に向上した。

今後の展望

データ収集とファインチューニングのパイプラインはすでに構築されており、今後も継続的な開発サイクルによってモデルを改善し続ける計画である。

おわりに

Amazon Nova 2 の各モデルファミリーの違いや適性について解説されており、あたらしくリリースされたモデルについての理解が深まりました。

その上で、ユースケースに即したカスタマイズの手法や方向性についての解説もされていました。
公式の動画も公開されたことで再度復習したいと思います。


www.youtube.com

ではまた。

市野 和明 (記事一覧)

マネージドサービス部・AWS サポート課

お客様から寄せられたご質問や技術検証を通じて得られた気づきを投稿していきます。

情シスだった前職までの経験で、UI がコロコロ変わる AWS においては GUI で手順を残していると画面構成が変わってしまって後々まごつくことが多かった経験から、極力変わりにくい AWS CLI での記事が多めです。

X(Twitter):@kazzpapa3(AWS Community Builder)