Amazon BedrockでAIモデルのパラメータ検証していたらカップラーメンが破壊されるとか言ってきた

記事タイトルとURLをコピーする

今回のブログでは、Amazon Bedrock の Playground で Amazon Nova Lite 1.0 に同じプロンプトを投げ、温度(Temperature) だけを変えて出力がどう変わるかを実際に試した結果を共有します。AWS Certified AI Practitioner(AIF-C01)の試験対策の一環で実際に触ってみたことをまとめた内容になります。

用語解説

本題に入る前に、本記事に関連する3つの推論パラメータ(温度・トップP・トップK)について整理しておきます。AWS公式ドキュメントの Influence response generation with inference parameters では、これらは「ランダム性と多様性(Randomness and diversity)」を制御するパラメータとして紹介されています。

温度(Temperature)

温度(Temperature)とは、いわば「AIの言葉選びの大胆さツマミ」です。AWS公式ドキュメントでは「予測される出力の確率分布の形状に影響し、モデルが低確率の選択肢を選ぶ可能性を左右する」と定義されています。

  • 低い値:確率分布が 急峻(steep) になり、高確率のトークンが選ばれやすくなる(出力が決まりきった内容に寄る)
  • 高い値:確率分布が 平坦(flat) になり、低確率のトークンも選ばれやすくなる(出力にばらつきが出る)

Amazon Nova モデルの場合、API 仕様上は 0より大きく1.0未満(デフォルト 0.7) で設定します。なお、Amazon Bedrock の Playground 上ではスライダーが 0〜1 の範囲で操作できます。

トップP(Top P)

トップP(Top P)とは、いわば「累積確率での足切り」です。AWS公式ドキュメントでは「次のトークンとしてモデルが考慮する、最も可能性の高い候補の割合(%)」と定義されています。

たとえば Top P = 0.8 とすると、候補トークンを確率の高い順に並べ、累積確率が80%に達するまでのトークンだけを次のトークンの候補として扱います。Amazon Nova モデルの API 仕様上は 0より大きく1.0以下(デフォルト 0.9) です。

トップK(Top K)

トップK(Top K)とは、いわば「上位何個までを候補にするか」の指定です。AWS公式ドキュメントでは「次のトークンとしてモデルが考慮する、最も可能性の高い候補の数」と定義されています。

たとえば Top K = 50 とすると、毎ステップ確率の高い上位50個のトークンの中から次のトークンが選ばれます。Amazon Nova モデルの API 仕様上は 0以上(デフォルト 50) です。

なお、Amazon Bedrock の基底推論パラメータ(base inference parameters)として定義されているのは maxTokens stopSequences temperature topP の4つで、トップKはモデル固有のパラメータ として扱われます(Anthropic Claude などで対応)。そのため、Amazon Bedrock の Playground でも モデルによって設定できるパラメータの組み合わせが異なる 点に注意です。

検証の前提

今回の検証は以下の前提で実施しました。

  • 検証日時:2026年5月時点
  • リージョン:米国東部(バージニア北部、US-EAST-1)
  • モデル:Amazon Nova Lite 1.0(オンデマンド)
  • 操作環境:Amazon Bedrock の Playground
  • 変更するパラメータ:温度のみ(トップPや最大出力トークンはデフォルト値のまま)
  • プロンプト:最高に美味しいカップラーメンの作り方を教えてください。(3回とも同一)

検証時は Admin 権限でログインしていますが、実際の業務では Amazon Bedrock の利用に必要な権限のみを付与した IAM ロール/ユーザー等で操作することをおすすめします。

検証準備

Amazon Bedrock の Playground を開く

マネジメントコンソールで Amazon Bedrock のサービス画面を開き、左メニューの「テスト」配下にある「Playground」を選択します。 Playground は Amazon Bedrock コンソールの「テスト」セクション配下にあります。

Amazon Bedrock のサイドメニューから Playground を選択

Playground を開くと、まだモデルが選択されていない状態の画面が表示されます。中央の「モデルを選択」ボタンから、検証で使うモデルを選びます。

Playground の初期画面。中央の「モデルを選択」から検証するモデルを指定する

モデルを選択する

今回は Amazon の Nova Lite 1.0 を使用します。カテゴリで「Amazon」を選び、モデル一覧から「Nova Lite 1.0」を選択、推論は「オンデマンド」のままにします。

カテゴリで「Amazon」、モデルで「Nova Lite 1.0」、推論は「オンデマンド」を選択

パラメータ設定パネルを開く

モデルを選択するとプロンプト入力画面に戻ります。画面左上のモデル名の隣にある 設定アイコン をクリックすると、温度などのパラメータを変更できるパネルが開きます。

モデル選択後の Playground 画面。左上の設定アイコンからパラメータを変更する

Nova Lite 1.0 の設定パネルでは、「ランダム性と多様性」セクションに 温度トップP が用意されています。今回はここで温度の値だけを変えて検証していきます。 ※Nova Lite 1.0 のスライダーは温度・トップPともに 0〜1 の範囲で動かせます。

Nova Lite 1.0 のパラメータ設定パネル。温度とトップPが設定可能

プロンプトを入力

プロンプト入力画面へ、プロンプトを入力し実行していきます。

プロンプト入力例

検証1:温度 0 に設定

まずは温度を最小値の 0 に設定して実行してみます。

出力は以下のような内容になりました(抜粋)。

最高に美味しいカップラーメンを作るには、いくつかのポイントがあります。まず、基本的な作り方を紹介し、その後に、さらに美味しくするためのコツをいくつか紹介します。

基本的な作り方

  1. 麺を茹でる:カップラーメンの麺を茹でる際は、お湯が沸騰してから麺を入れましょう。
  2. スープを加える:麺を茹でている間に、カップに付属のスープを入れておきます。
  3. お湯を注ぐ:麺を茹で終えたら、お湯をカップに注ぎます。
  4. 具材を加える:カップラーメンに付属の具材を加えます。

美味しくするためのコツ

  1. 卵を入れる:トロミのあるスープができます。
  2. 具材を増やす:チャーシューやキムチ、コーンなどを追加すると、味がより豊かになります。
  3. スープをアレンジする:醤油や塩、胡椒などを加えて味を調整します。
  4. 温かいご飯を添える:食べ応えが増します。

「麺を茹でる」のくだりはカップラーメンとして若干違和感はありますが(?)、全体としては破綻のない、おとなしいアレンジ案に収まっています。温度が低いと 確率分布が急峻になり、高確率のトークンが選ばれやすくなる という公式の説明どおりの挙動ですね。

検証2:温度 0.5 に設定

次に温度を 0.5 に上げて、同じプロンプトを投げてみます。

出力は以下のような内容になりました(抜粋)。

美味しくするためのコツ

  1. 温かいご飯をトッピングする
  2. 半熟卵を入れる
  3. アレンジ具材を加える
    • 冷蔵庫にある野菜(キャベツ、ニンジン、ネギなど)を刻んで加える。
    • 缶詰や冷凍食品の具材(ツナ缶、キムチ、ニラなど)でアレンジ。
    • 豆乳や生クリームを少し加えて、まろやかな味わいに。
  4. 調味料で味の調整をする
    • お好みで、コショウ、七味、酢、塩、胡椒などで味の調整をします。
    • ラー油や一味を少し加えることで、スパイシーな風味を加えることができます。
  5. 香辛料やハーブをプラスする

温度0のときに比べて、「豆乳や生クリームを少し加える」「香辛料やハーブをプラスする」など、ややクセのあるアレンジが出てくるようになりました。多様性が増してきました。

検証3:温度 1 に設定(最大値)

最後に温度を最大値の 1 に設定して実行してみます。

出力は以下のような内容になりました(抜粋)。

基本のカップラーメン作り方

  1. 準備:カップラーメンを取り出します。スープと乾燥麺をカップに入れます。
  2. 熱湯を注ぐ:カップラーメンの適量の熱湯を加えます。3〜4分待ちます。
  3. 蓋を閉めて待つ:蓋をして、麺がほぐれるまで待ちます。
  4. 完成:具材やトッピングを加えてから、しっかり混ぜて完成です。

美味しくするためのコツ

1. 熱湯だけでなくジッパー付きのバッグやポットから湯を注ぐ

直接ケトルややかんから湯を素早く注ぐと、カップラーメンの容器が破損する可能性があります。 ジッパー付きの湯沸しバッグや茶ポットなどを使用すると、コントロールしやすく便利です。

「ケトルから湯を注ぐと容器が破損する」というのは現実のカップラーメンではまず起こりません。温度を上げたことで多様性が増した一方、事実と異なる内容(ハルシネーション)が混ざってきました

Nova Lite 1.0的にはこのイメージらしい

※Amazon Nova の API 仕様上は temperature の値は 0より大きく1.0未満 が有効範囲とされていますが、Amazon Bedrock の Playground 上はスライダーが 0〜1 の範囲で動かせるため、UI上は 1 まで指定できる状態です。

ご参考(Claude Sonnet 4.5との比較)

参考までに Claude Sonnet 4.5 でも温度 0〜1 の範囲で同じプロンプトを投げてみたところ、いずれの温度でも目立ったハルシネーションは出ませんでした。

これはあくまで肌感ですが、Claude 系のモデルは人間のフィードバックによる強化学習(RLHF: Reinforcement Learning from Human Feedback)が強くかかっており、温度を上げても「常識」の枠から大きく外れにくいのではないかと感じます。どのモデルでも温度を上げれば同じ挙動になる、というわけではない ということですね。

また、Claude Sonnet 4.5 の設定パネルでは、「ランダム性と多様性」セクションに 温度トップK が表示されています(「制御の基準」を切り替えるとトップPに変更可)。モデルによって設定できるパラメータが異なる のは、Amazon Bedrock の基底推論パラメータがトップPまでで、トップKがモデル固有のパラメータとして扱われているためですね。

まとめ

最後に今回の検証で得られた学びをポイント形式で振り返ります。

  • 温度(Temperature) は確率分布の形状を調整するパラメータで、低いほど決まりきった出力、高いほど多様な出力になる
  • Amazon Nova の API 仕様上、温度は 0より大きく1.0未満(デフォルト 0.7)、Amazon Bedrock の Playground 上は 0〜1 のスライダーで操作可能
  • トップP は累積確率ベース、トップK は上位K個ベースで次のトークン候補を絞る方式
  • Amazon Bedrock の基底推論パラメータは温度・トップP まで。トップKはモデル固有のパラメータ として扱われるため、モデルによって設定できるパラメータが異なる
  • 温度を上げるとアレンジの幅が広がる一方、ハルシネーションのリスクも増える(カップラーメンの容器が破損する、など)

おわりに

ちなみに本記事を投稿する前に AWS Certified AI Practitioner には合格してました(笑)。コンソールで実際にスライダーを動かして出力の変化を見ることで、用語の理解が一気に進んだ実感があります。

このブログを通して、これから試験対策する方や、Amazon Bedrock を実務で使い始めようとしている方が、推論パラメータの挙動について「あぁ、こういうことか」と腹落ちするきっかけにしていただけたら幸いです。

ブログ書いてから、日清食品「カップヌードル レッドシーフードヌードル」が待ち遠しくなってきました。。 ※個人的夏の風物詩、早く食べたい

最後までお読みいただき、ありがとうございました。

参考文献

今野 祐靖(執筆記事の一覧)

2024年4月中途入社 年間約300日ととのうサウナー