【AWS re:Invent 2025】自社専用の"フロンティアモデル"を作る時代へ。「Amazon Nova Forge」徹底解説

こんにちは。サーバーワークスの岡部です。

AWS re:Invent 2025 で発表された数多くのアップデート、皆様はすでにキャッチアップされましたでしょうか？
今回の Keynote では、生成 AI 周りのエコシステムが一気に拡充された印象ですが、その中でも私自身が「これは潮目が変わるかもしれない」と強く惹かれたサービスがあります。

それが、「Amazon Nova Forge」です。

今回は、現時点で公開されている情報をベースに、なぜこのサービスが革新的と言えるのか、私たちエンジニアや企業にとってどういう意味を持つのかを、技術的な観点も含めて深掘りしていきたいと思います。

はじめに

まず、サービスの具体的な解説に入る前に、名前の由来について少し触れさせてください。

「Forge」という単語、RPG などのゲームが好きな方なら聞き馴染みがあるかもしれません。英語で「鍛冶場」や「鍛造（たんぞう）する」という意味を持ちます。鉄を熱し、ハンマーで打ち、不純物を取り除きながら強靭な鋼へと鍛え上げる場所のことです。

これまでの LLM（大規模言語モデル）の活用は、どちらかと言えば「既製品の剣（モデル）を買ってきて、それをどう振るうか（プロンプトエンジニアリング）」や「持ち手を少し加工する（ファインチューニング）」といったアプローチが主流でした。

しかし、今回発表された Amazon Nova Forge に込められた思いは、おそらく異なります。「鉄（モデルの基礎）を打って強くするように、モデルを自社のデータで徹底的に鍛え上げる」そんな、ものづくりへの原点回帰とも言える熱量が、この「Forge」という名称から感じ取れます。

AWS が新たに投入した基盤モデル「Amazon Nova」シリーズ。これ自体も非常に強力ですが、それをさらに自社の色に染め上げるための工房が Nova Forge です。
では、具体的に何ができるのかを見ていきましょう。

いきなりまとめ

詳細を読む時間がない方のために、Amazon Nova Forge の要点を 3 行でまとめます。

AWS の新モデル「Amazon Nova（Lite/Pro）」をベースに、企業独自データを用いて「学習段階から」介入できるマネージドサービス。
従来のファインチューニングとは異なり、AWS が持つチェックポイント（事前学習・中間学習データ）にアクセスし、自社データを混合（ブレンド）して「自社専用の基盤モデル（Novellas）」を作れる。
ただし、「モデルを鍛える」プロセスには強力な計算リソースを消費するため、通常の API 利用とは桁違いのコスト投資と、シビアな ROI（投資対効果）判断が前提となる。 Nova pricing

要するに、「ありものの AI」を使うのではなく、「自分たちだけの最強の AI」を作るためのプラットフォームです。

Amazon Nova Forge とは

概要

Amazon Nova Forge は、AWS の新しい基盤モデルである「Amazon Nova」シリーズ（具体的には Nova 2 Lite や Nova 2 Pro など）をベースに、企業が独自のデータを組み合わせてカスタムモデルをトレーニングできるサービスです。

これによって作成された独自のフロンティアモデルは「Novellas（ノベラス）」と呼ばれます。

特筆すべきは、そのアプローチ手法です。AWS はこれを「Open Training（オープントレーニング）」と呼んでいます。
単に完成したモデルの上っ面を調整するのではなく、モデルがまだ言葉や概念を学んでいる「途中経過」に介入できる点が、これまでのサービスとは決定的に異なります。
これは ChatGPT や Gemini でも現時点では対応していない機能となります。

技術的な仕組み

Nova Forge の裏側では、Amazon SageMaker の堅牢な機械学習パイプラインと、AWS Trainium（機械学習専用チップ）による強力な計算リソースが動いています。

チェックポイントへのアクセス
- 通常、LLM の事前学習（Pre-training）データや重みはブラックボックスです。しかし Nova Forge では、事前学習、中間学習（Mid-training）、事後学習（Post-training）の各段階における Nova のチェックポイントを利用できます。
データブレンディング
- 企業は、AWS が用意した高品質な汎用データセットと、自社が保有する独自の専門データ（ドメインデータ）を混合して学習させることができます。
Amazon Bedrock へのデプロイ
- 鍛え上げられたモデル（Novellas）は、そのまま Amazon Bedrock 上にプライベートモデルとしてインポートして利用できます。つまり、アプリ開発者はこれまで通り Bedrock API を叩くだけで、自社特化の超高性能モデルを利用できるわけです。

今までとの違い

「自社データで AI を賢くする」という文脈では、これまでもいくつかの手法がありました。なぜ今、Nova Forge が必要なのでしょうか？
既存の手法と比較してみます。

1. RAG（検索拡張生成）との違い

現在、最も一般的な手法は RAG です。これは、社内ドキュメントを検索し、その結果をプロンプトに含めて AI に回答させる方法です。

RAG の限界:
- あくまで「カンニングペーパーを見ながら答えている」状態です。モデル自体が知識を持っているわけではないため、複雑な推論が必要な場合や、業界特有の「暗黙知」や「文脈」を理解させるには限界があります。また、プロンプトに含められる情報量（コンテキストウィンドウ）にも制約があり、検索コストやレイテンシも課題になります。
Nova Forge の優位性:
- 知識そのものをモデルの脳内に焼き付けます。カンニングペーパーなしで、専門用語や社内ルールを「常識」として理解した状態で回答できるようになります。

2. 従来のファインチューニング（SFT）との違い

これまでのファインチューニング（Instruction Tuning / SFT）は、完成済みのモデルに対して「こういう質問が来たらこう返す」という「振る舞い」を教えるのが主でした。

従来の限界:
- これは人間に例えると、大学を卒業した新入社員に「ビジネスマナー研修」をするようなものです。挨拶やメールの書き方は覚えられますが、基礎的な学力や専門知識そのものを根本から変えることは困難でした。また、無理に新しい知識を詰め込むと、元々持っていた汎用的な知識を忘れてしまう「破滅的忘却（Catastrophic Forgetting）」のリスクがありました。
Nova Forge (Continued Pre-training / Mid-training) の革新性:
- Nova Forge は、モデルの「学習途中」に介入します。人間に例えると、「小中学校や高校の授業カリキュラムに、自社の専門科目をねじ込む」ようなものです。基礎的な言語能力や論理的思考力が形成される段階で、自社のドメイン知識（例えば特殊な化学式、独自のプログラミング言語、複雑な金融規制など）を大量に浴びせます。その結果、その分野の知識を「ネイティブ」として操れる AI が誕生します。

日本企業の快挙：ソニーグループの事例

この Nova Forge の有用性を証明する強力な事例として、今回の re:Invent 基調講演でソニーグループが紹介されました。
AWS CEO の Matt Garman 氏の Keynote に日本企業が登壇するのは初めてのことです。

この事例は、「AI を利用する」フェーズから「AI を開発・カスタマイズする」フェーズへ、日本企業が最先端で踏み込んだ象徴的な出来事だと言えます。

ユースケース

では、具体的にどのような場面で Nova Forge が「刺さる」のでしょうか。単なるチャットボット作成なら RAG で十分です。Nova Forge が必要になるのは、以下のような「深い専門性」や「独自性」が求められる領域です。

1. 業界特化型モデルの構築（製造・金融・医療）

一般的な LLM は、インターネット上のデータで学習しているため、極めてニッチな専門用語や記号を正しく扱えません。

製造業:
- 工場内のセンサーログ、独自の設計図面記号、社内規格のコードなどを学習させることで、異常検知の精度向上や、熟練工のノウハウ継承（暗黙知の言語化）に活用できます。
創薬・化学:
- 特殊な分子構造式や、実験データの記述形式を「言語」として学習させることで、新素材の探索や実験結果の予測精度の向上が期待できます。Nimbus Therapeutics などのバイオ企業がすでに参加しているのもこのためです。

2. 言語・文化への深い適応

マイナー言語・方言:
- インターネット上にデータが少ない言語や、特定の地域の方言、あるいは若者言葉や社内スラングなどを学習させることで、ターゲット層に完全にマッチした対話モデルを作成できます。
企業文化（Culture）の反映:
- 「弊社の社員らしい回答」や「ブランドボイス」を徹底させたい場合、プロンプトでの指示には限界があります。学習段階で膨大な社内メールや日報、企画書を読ませることで、その会社の「空気感」を理解した AI を作ることが可能になります。

3. 高度なセキュリティ要件とクローズド環境

データレジデンシーと秘匿性:
- 金融機関や政府機関など、外部 API にデータを送信すること自体がリスクとなるケースです。Nova Forge で作成したモデルは、自社の AWS アカウント（VPC 内）で管理される Bedrock のプライベートモデルとして扱えます。学習データそのものが極秘（未発表の製品情報や個人情報を含むなど）である場合、外部に出さずに自社専用の「頭脳」として保有できる点は大きなメリットです。

改めてまとめ

最後に、Amazon Nova Forge の登場が示唆する未来についてまとめます。

総括：「AI を使う会社」から「AI を鍛える会社」へ

これまで、高性能な LLM を作れるのは、OpenAI や Google、そして AWS のような巨大テック企業だけだと思われていました。しかし、Nova Forge の登場により、「自社のデータさえあれば、誰でも世界最高峰のフロンティアモデルをカスタマイズして保有できる」時代が到来しました。

これは、企業の競争力の源泉が「どの AI モデルを使うか」から、「どれだけ良質な自社データ（＝独自資産）を持ち、それをどう AI に学習させるか」へとシフトすることを意味します。

利用時の注意点：魔法の杖ではない

もちろん、素晴らしいことばかりではありません。エンジニアとして冷静に見ておくべき課題もあります。

コストとリソース:
- 継続的な事前学習には、AWS Trainium などの計算リソースを大量に消費します。API 利用料とは桁の違うコストがかかる可能性があります。ROI（投資対効果）のシビアな計算が必要です。
データの「質」と「量」:
- AI 開発における格言「Garbage In, Garbage Out（ゴミを入れたらゴミが出る）」は、Nova Forge においても絶対です。ただデータがあればいいわけではありません。ノイズを除去し、整形された高品質なデータセットを用意する、泥臭い前処理こそが成否を分けます。
専門知識（Data Scientist）:
- ボタン一つで終わるものではありません。学習率の調整、データレシピの配合比率など、データサイエンスの深い知見が求められます。

私たちエンジニアができることは何でしょうか？

まずは、ベースとなる Amazon Nova (Lite/Pro/Micro) を Amazon Bedrock で徹底的に使い倒してみることです。その上で、RAG やプロンプトエンジニアリングではどうしても超えられない「壁」——例えば、専門用語の理解不足や、応答速度、コンテキストの限界——にぶつかった時、「そういえば、Nova Forge で自社モデルを鍛えるという選択肢があったな」と思い出してください。

「まずは PoC で、特定の業務に特化したミニモデルを試作してみる」そんな提案が、半年後のあなたの会社のビジネスを変えているかもしれません。

それでは、また次回。