やさしい AIF(ドメイン 2)

記事タイトルとURLをコピーする

おなかが痛くてもコーヒーは飲む、近藤恭平です。

前回は機械学習の基礎(教師あり・なし・強化学習、回帰・分類)を整理しました。今回は生成 AI(Generative AI)について解説します。試験ガイドのドメイン2に対応した内容です。


生成 AI とは

予測と生成

これまでの機械学習は、データのパターンを学習し「予測・分類」を行うことが主な役割でした。生成 AI はそこから一歩進み、新しいデータ(テキスト・画像・音声など)を「作り出す」ことができます。

比較軸 予測 AI 生成 AI
明日の天気を予測する 挨拶のメールの文章を作る
キーワード 回帰・分類 FM・LLM・Diffudion Model

基盤モデル(FM)と大規模言語モデル(LLM)

試験ガイドに頻出するのが基盤モデル(Foundation Models / FM)という概念です。膨大なデータで事前学習済みの汎用 AI で、様々なタスクに転用できます。その中でも「言語」に特化したものを大規模言語モデル(LLM / Large Language Models)と呼びます。

用語 位置づけ
基盤モデル(FM) テキスト・画像・音声など複数のモダリティを扱える大型の事前学習モデル全般
LLM FM の中でもテキスト生成・理解に特化したもの(例:GPT 系、Claude 系)

トークン

AI が文字を処理する際の最小単位です。「文字数」ではなく「トークン数」でコストと処理量が決まります。

具体例: "hello" は1トークン、"unhappiness" は複数トークンに分割されることがあります。日本語は英語より1文字あたりのトークン数が多くなる傾向があるため、長文処理のコストが高くなりやすいです。

OpenAI が Web でトークンを解析できるツールを提供しています。テキストがトークンに分割される例を確認してみてください。

platform.openai.com

埋め込み(Embedding)とベクトル

埋め込み

AI はテキストをそのまま処理できません。まず文字を数値の配列(ベクトル)に変換してから計算します。この変換プロセスを埋め込み(Embedding)と呼びます。

意味が近い言葉ほどベクトル空間上で近い位置に配置されるため、「類似度」を数値として計算できます。

具体例: 「猫」と「ネコ」のベクトルは近い位置に、「猫」と「請求書」のベクトルは遠い位置に配置されます。この性質を使って、意味的に近い文書を検索する(RAG)ことが可能になります。

ベクトルの近さだけではなく、ベクトル同士の位置関係も意味を持ちます。例えば「男」と「キング」を意味する2つのベクトルの関係は、「女」と「クイーン」のベクトルの関係と似ています。

自己注意機構(Attention)

トランスフォーマーの核心となる仕組みです。文章全体を並列で参照し、どのトークンが他のどのトークンと関係が深いかを計算します。

  • 長距離の依存関係(文の最初と最後のつながり)を捉えられる
  • 「銀行(bank)」が「川岸」か「金融機関」かを前後の文脈から判断できる

トランスフォーマー(Transformers)

トランスフォーマーとは、現在の生成AI(LLM)の基盤となっている「モデルの全体構造」のことです。文章を端から順番に読み込むのではなく、全体を一度に並列処理することで、言葉同士の複雑な関連性を瞬時に、かつ効率的に計算できる設計図のような役割を果たします。

この構造によって、膨大なデータを高速で学習し、人間のように自然な文脈を理解・生成することが可能になりました。

生成 AI の主なアーキテクチャ

アーキテクチャ 概要 得意なタスク
Transformer 自己注意機構をベースにした現代の主流構造 テキスト生成・翻訳・要約
拡散モデル(Diffusion Models) ノイズを段階的に除去して画像を復元する仕組み。Stable Diffusion が代表例 画像生成
敵対的生成ネットワーク(GAN) 「生成器」と「識別器」が競い合いながら学習する構造 画像生成・データ拡張
変分オートエンコーダー(VAE) データを圧縮・復元しながら潜在空間を学習する構造 画像生成・異常検知

転移学習

転移学習

転移学習(Transfer Learning)とは、汎用データで学習済みの基盤モデルを出発点として、特定のタスクや業務に合わせて追加学習する手法です。

一般的な基盤モデルをゼロから作成することは極めて高コストです。転移学習を使えば、既存モデルの知識を活用しつつ、少ないデータとコストで目的のモデルを構築できます。

具体例: 一般的なテキスト生成モデルをベースに、自社の規程や FAQ データで追加学習し、社内向け Q&A ボットを構築する。


生成 AI 特有の挙動

非決定論的出力

生成 AI は「確率の計算」によって次のトークンを選択しています。

従来の機械学習の出力は同じ入力に対して常に同じ結果を返す決定論的(Deterministic)な挙動ですが、生成 AI の出力は毎回異なり得る非決定論的(Non-deterministic)な挙動です。

ハルシネーション(Hallucination)

AI が事実と異なる内容を、高い確信度で出力してしまう現象です。確率で言葉を繋いでいるため、「もっともらしいが誤り」の情報を生成するリスクがあります。

具体例: 「A 社の設立年を教えて」と質問したとき、AI が実際とは異なる年を自信をもって答える。

確率的な挙動(Probabilistic)

同じ入力を与えても、毎回異なる出力が返り得る性質のことです。これは欠陥ではなく、多様な表現を生成するための設計です。

マルチモーダル(Multimodal)

テキストだけでなく、画像・音声・動画など複数のモダリティを同時に入出力できる能力のことです。

具体例: 画像を入力として「この図の内容を300字で説明して」とテキストで指示し、テキストで回答を得る。


推論パラメータ

生成 AI の出力特性を制御する設定値です。用途に応じて調整します。

Temperature(温度)

次のトークンを選ぶ際の「ランダム性」を制御します。

  • 高い(例:1.0 に近い): 多様で創造的な出力になります。アイデア出しや文章生成に向いています。
  • 低い(例:0 に近い): 一貫性が高く再現性のある出力になります。コード生成や事実確認に向いています。

Top-P / Top-K

どちらも「次のトークン候補を絞り込む」設定です。Temperature と組み合わせて使います。

パラメータ 絞り込みの基準
Top-K 確率上位 K 個のトークンのみを候補にする
Top-P 累積確率が P に達するまでのトークンを候補にする

生成 AI の評価指標

生成 AI の出力品質を測る指標は、従来の機械学習(精度・F1スコアなど)とは異なります。代表的なベンチマークを以下に示します。

指標 概要 用途
ROUGE 自動生成した要約を人間が作成した要約と比較し、一致度を測る 要約・翻訳の品質評価
BLEU 機械翻訳したテキストを人間が生成したテキストと比較し、精度を測る 翻訳品質の評価

業務での活用ケースの例

試験では「この業務に生成 AI は適切か」という判断問題も出題されます。代表的なユースケースを押さえておきます。

ユースケース 具体的な業務例
テキスト要約 長文の議事録・契約書の要点を自動抽出する
コンテンツ作成 募集要項・マニュアル・メールのドラフトを生成する
コード生成 Excel マクロ(VBA)や SQL の作成を補助する
Q&A 応答 社内規程・FAQ に基づいた問い合わせ対応を自動化する

AWS の生成 AI サービス

AWS は生成 AI アプリケーションの開発に特化した複数のサービスを提供しています。試験では各サービスの「役割の違い」を問われます。

サービス 位置づけ 主な対象ユーザー
Amazon Bedrock フルマネージドな基盤モデル API。Claude・Titan・Llama 等を API 経由で利用できる 開発者・エンジニア
Amazon SageMaker JumpStart 事前学習済みモデルのワンクリックデプロイとファインチューニング環境 ML エンジニア・データサイエンティスト
PartyRock ノーコードで生成 AI アプリを試作・共有できるプレイグラウンド ビジネスユーザー・非エンジニア
Amazon Bedrock Playground Bedrock 上のモデルをコンソールから即座に試験できる実験環境 開発初期の検証・プロンプト調整
Amazon Q ビジネス向け生成 AI アシスタント。Amazon Q Business(社内データ連携)と Amazon Q Developer(コード支援)の2系統 業務担当者・開発者

AWS で構築するメリット

生成 AI アプリケーションを AWS 上で構築することには、インフラを自前で用意する場合と比較して明確な優位性があります。

  • アクセシビリティ: API を呼び出すだけで最先端の基盤モデルを利用開始できます。GPU サーバーの調達や環境構築は不要です。
  • 参入障壁の低さ: PartyRock のようなノーコードツールから始められるため、ML の専門知識がなくてもアプリケーションの試作が可能です。
  • 効率性: マネージドサービスがインフラ管理・スケーリング・パッチ適用を担うため、開発チームはアプリケーションロジックに集中できます。
  • 費用対効果: 従量課金モデルにより、PoC フェーズでは小額からスタートし、本番規模に合わせてスケールできます。
  • ビジネス目標の達成能力: Amazon Q Business のような業務特化サービスを活用することで、社内ナレッジ検索・コスト削減・顧客対応自動化などの具体的なビジネス成果に直結させられます。

AWS インフラストラクチャの利点

AWS の生成 AI サービスは、エンタープライズ利用に求められるインフラ基盤の上に構築されています。

  • セキュリティ: VPC プライベートエンドポイント・IAM によるアクセス制御・AWS KMS による暗号化が標準で統合されており、モデルへのアクセスを細粒度で制御できます。
  • コンプライアンス: AWS はISO 27001・SOC 2・HIPAA・PCI DSS など多数の第三者認証を取得済みです。
  • 責任共有モデル: インフラ層の責任は AWS が負い、アプリケーション層・データ管理の責任はユーザーが負います。生成 AI においては「モデルの動作」に対する責任の所在を明確にする観点が試験でも問われます。
  • 安全性: Amazon Bedrock Guardrails を使用することで、有害コンテンツのフィルタリング・トピック制限・個人情報のマスキングをアプリケーション側に実装できます。

コストとトレードオフ

生成 AI サービスの料金モデルは複数あり、それぞれに応答性・可用性・コストのトレードオフが存在します。要件に合わせて選択することが重要です。

料金モデル 概要 向いているケース トレードオフ
トークンベースの料金設定 入出力トークン数に応じて従量課金。Amazon Bedrock のデフォルト 利用量が変動する PoC・検証フェーズ ピーク時のコスト予測が難しい
プロビジョンスループット 特定のスループット(トークン/秒)を事前確保し、時間単位で課金 大量かつ安定したリクエストが見込まれる本番運用 未使用時もコストが発生する
カスタムモデル 自社データでファインチューニング済みモデルを専用環境にデプロイ 特定ドメインで高精度が必要な用途 初期学習コストと継続ホストコストが高い

その他、設計時に考慮すべきトレードオフを以下に整理します。

観点 内容
応答性(レイテンシ) リアルタイム対話はレイテンシ最小化が優先。バッチ処理ならスループット最大化が優先
可用性・冗長性 Bedrock はマルチ AZ 構成で高可用性を提供。クロスリージョン推論を使うと障害時の継続性が向上する
パフォーマンス より大規模なモデルは精度が高い一方、レイテンシとコストが増大する
リージョン展開 サービスや特定モデルが利用可能なリージョンは限られる。データレジデンシー要件と合わせて確認が必要

次回は、この生成 AI を業務専用にカスタマイズする手法(RAG・プロンプトエンジニアリング・ファインチューニング)を解説します。

2021年4月新卒入社。目に見えて、動かせるものが好き。