Gemini 3 Pro+Nano Banana ProでAWS構成図をどこまで読み書きできるか試してみた

記事タイトルとURLをコピーする

こんにちは、サーバーワークスの椿山です。

12/01~12/05にいよいよ開催されるAWS re:Invent 2025を前に、AWSアップデート情報も続々と発表されていますね。 弊社でも特設サイトがオープンしましたが、re:Invent関連の熱い情報は他のメンバーにお任せするとして。。

今回は、11/21(金)に公開されたの Gemini 3 Pro+Nano Banana Pro が大きな話題を集めているため、本ブログでも取り上げてみたいと思います。 きっかけは、弊社代表の大石がX(旧Twitter)でつぶやいていたこちらの投稿です。

この画像、私が通勤中に社用のスマホから雑なプロンプトで生成してみたところ、あまりの正確さに驚いて社内のSlackで共有したのがきっかけでした。 Nano Banana Proの生成画像の特に日本語の品質が格段に向上しており、インフォグラフィック(いわゆる「霞ヶ関風ポンチ絵」レベルまで)やマンガなど、これまでは難しかった内容もGeminiが収集・整理して画像生成できるようになったとのこと。 そこで今回は、「Gemini 3 Pro+Nano Banana ProでAWS構成図をどこまで読み書きできるか」 を試してみました。

Gemini 3 Pro、Nano Banana Proとは

概要:最新アップデート情報のまとめ

deepmind.google

Gemini 3 Proは、Google DeepMindが2025年11月21日に発表した最新の生成AIモデルです。主なアップデート情報は以下の通りです。

  • Gemini 3 Pro: 推論能力とマルチモーダル処理性能が大幅に強化された最新のLLM。
  • Nano Banana Pro: 画像生成モデル。特に日本語テキストを含む画像の生成品質が飛躍的に向上しました。
    • これまでは崩れがちだった図解内の日本語文字が、インフォグラフィックやマンガ形式でも実用に近いレベルで生成可能です。
    • 複雑な情報をGemini 3 Proが収集・整理し、それをNano Banana Proが「霞ヶ関風ポンチ絵」や「チートシート」として一枚絵に出力する連携が可能になりました。
  • Enterpriseエディション対応: 弊社で契約しているGoogle Workspace Enterpriseエディションでも利用可能です(今回の検証ではこれを利用します)。
    • 同エディションのGeminiチャットに入力したデータはモデルのトレーニングには使用されません。
    • その他のコンシューマー向けGeminiなどを利用する際は、入力する情報の取り扱いに十分ご注意ください(特に個人情報を含む機密事項の入力は厳禁です)

ビジネスでの利用方法のアイディア

構成図の検証に入る前に、ビジネスで使えそうなアイディアをいくつか考えてみました。それをGemini 3 Pro+Nano Banana Proに図解させたインフォグラフィックがこちら。

分析・リサーチ、企画・提案、情報共有・記録、教育・学習などさまざまな分野で活用可能

テキストだけでは伝わりにくい、または読み手に負荷がかかる情報も、ビジュアル化することで直感的に理解しやすくなりそうです。

AWSインフラ構成図の読み書きを現時点でどこまで行えるのか?

それでは本題です。AWSインフラ構成図の「読み」と「書き」について検証していきます(※本検証での評価はあくまで個人の所感となりますので、予めご了承ください)。

(1) 読み(構成図の読み取り・内容の把握)

まずは「読み」の検証です。 サンプルとして、中途入社研修の後半に行った提案模擬案件にて、架空のお客様向けにCacooで作成した構成図を使用します*1。 この構成図だけをGemini 3 Proに渡し、構成概要を把握・説明できるか試してみます。

中途入社研修の後半に行った提案模擬案件で作成した架空のお客様向けの構成図

プロンプト例

添付のAWS構成図を説明する資料を作成したいです。主な構成要素の名称と概要を一覧表にまとめてください。 PowerPointのA4横長のスライド1ページに収まる表にしたいです。 細かすぎると量が多くなるので、重要な構成要素を15個程度に絞ってください。

結果・所感

概要の説明内容は概ね妥当なものでした。 以前のGemini 2.5 Proでも日本語OCRを含めた画像認識は一定の精度が出ていましたが、Gemini 3 Proではさらにもう一段階精度が上がった印象です。 項目数に応じて適宜分類を集約したり分割したりといった調整も試しましたが、要約・分類等のタスクは生成AIが得意な領域であり、安定感のある回答が得られました。

(2-1) 読み書き(既存の構成図の一部修正・加工)

次に「読み書き」の検証です。 先ほどの構成図は多くの要素を盛り込んでいたため、提案プレゼン時にすべてを説明するのは大変です。 そこで、非機能要求のうち「可用性」「性能・拡張性」や「セキュリティ」といった特定の観点にフォーカスした構成図を作ってみます。

プロンプト例

添付のAWSインフラ構成図を読み取ったうえで、このうち「性能・拡張性」のための構成要素のみをピックアップして強調させた新しいAWS構成図のインフォグラフィックを作成してください (「性能・拡張性」に関与しない構成要素を削除して、お客様に「性能・拡張性」の説明を分かりやすく行いたいです)

結果・所感

「性能・拡張性」に関する構成要素をピックアップさせ、3回ほど修正させた画像

「セキュリティ」に関する構成要素をピックアップさせ、3回ほど修正させた画像

修正の途中で、指示していない構成要素を勝手に書き換えたり削除したり等、不安定な挙動も見られましたが、修正指示はそこそこ聞いてもらえる印象でした。 つまり、構成図の各要素を理解した上で、抽出する/強調・補足する/削除するといった判断が少しはできていることになります。

(2-2) 書き(テキスト情報から新規構成図の作成)

続いてはいよいよ、ゼロからの「書き」です。 中途入社研修の前半の最初の構築模擬案件(最小かつ旧来型のオーソドックスな構成*2を一人で&短期間で構築する課題)の構成情報をテキストで渡し、一から構成図を描かせてみました。

モデル構成図(これに近いものが生成できるか?)

中途入社研修の前半の最初の構築模擬案件で作成した架空のお客様向けの構成図

プロンプト例(テキスト情報のみで生成)

以下のインフラ構成からなる構成図をNano Banana Proの機能を利用してインフォグラフィックの1枚画像として生成してください。 背景は白色、言語は英語、各サービスの画像はAWSシンプルアイコンや各メーカーのロゴを利用してください。

インフラ構成のテキスト情報(長いので折り畳み:クリックすると展開)

カテゴリ 項目 詳細
インフラストラクチャ AWSアカウント 123456789012
リージョン AWS東京リージョン (ap-northeast-1)
可用性 Multi-AZ構成(AZ-A、AZ-C)
ネットワーク構成 VPC 1つ
Internet Gateway 1つ
通信経路(インバウンド:一般ユーザ) Internet -> IGW -> ALB -> EC2(Webサーバ2台) -> Aurora MySQL(Master/Read Replica)
通信経路(インバウンド:他ベンダー) Internet -> IGW -> ALB -> EC2(踏み台サーバ)
通信経路(アウトバウンド) EC2(踏み台サーバ、Webサーバ) -> NAT GW・Elastic IP -> IGW -> Internet
Public Subnet NAT Gateway 1つ(最小構成のため) + Elastic IP、AZ-A
踏み台サーバ EC2 (Amazon Linux 2023) 1台 + Elastic IP、AZ-A
ロードバランサー ALB、ターゲット: EC2 Webサーバ
SSL証明書 ACMでSSL証明書を発行、ALBに割り当て
Protected Subnet Webサーバ EC2 (Amazon Linux 2023) 2台、Apache + Ruby on Rails
Private Subnet データベース Aurora MySQL、Master 1台 + Read Replica 1台
運用 ログ CloudTrail・AWS Config・VPC Flow Logsを有効化、CloudWatchとS3に保存
運用 サーバーワークスの運用自動化ツール「Cloud Automator」と連携し、EC2(Webサーバ)2台とRDSを登録・管理
監視 New Relicと連携し、EC2(Webサーバ)2台とRDSを登録・監視

結果・所感

  • 全く同じプロンプトを何度かリロードした結果

↓リロード

↓リロード

  • 最初のプロンプトで生成された画像に何度か修正指示を加えた結果

↓修正指示

↓修正指示

ご覧いただいたとおり、新規作成時は構成図ガチャの要素が非常に大きく*3、最初の構成図が出力したいイメージからかけ離れている場合、修正指示を重ねていくのかかなりしんどいです。 他にもボツ案がいくつもありましたが、特に通信経路が少し複雑な構成図の描画は誤り(ハルシネーション)が多く、苦手なように見えます*4

(2-3) 書き(CloudFormationテンプレートから新規構成図の作成)

最後に、テキスト情報ではなく CloudFormationテンプレート を元に生成させてみます。 先ほどの構築模擬案件では、実際にはほぼ全てCloudFormationテンプレート化して構築していました。これをGeminiに丸ごと入力したら構成図の精度は上がるでしょうか?

プロンプト例

添付のCloudFormationテンプレート群を読み込み、内容を把握したうえで、AWS構成図を1枚の横長のインフォグラフィックとして生成してください。 ・背景:白 ・言語:すべて英語で表記

※現時点ではZIPファイルの中身が10ファイルを超えるとエラーとなるため、以下のLinuxコマンドで1つのMarkdownファイルに集約して渡しました。

  • CloudFormationテンプレート集約コマンド(サンプル)
find . -type f \( -name "*.yaml" -o -name "*.yml" -o -name "*.json" \) | sort | while read -r file; do
    echo "### File Path: $file"
    echo '```'
    cat "$file"
    echo -e "\n\`\`\`\n"
done > CloudFormation_templates.md

結果・所感

(2-2)のテキストベースよりも精度の良い構成図が生成されました。情報を細かく書きすぎではありますが、その内容も(一部を除き)だいたいは合っています。しかし、

  • インターネット → IGW → ALB → EC2(Webサーバ)のインバウンド
  • EC2 → NAT GW・Elastic IP → IGW → インターネットのアウトバウンド

といった通信経路については、(2-2)と同様に間違っていたり、ごっちゃになる傾向があります。このあたりはまだ学習や推論が十分ではないのかもしれません。 (なお、SSLやSSM等はマネジメントコンソール上で設定したため、今回のテンプレート由来の構成図には表れていません)

おまけ:さらに複雑な構成の場合

模擬構築案件のフェーズ2として、他のAWSアカウントとTransit Gateway (TGW) で接続する構成についてもCloudFormationを投げてみました。 最初は描画エリアが狭すぎて破綻してしまいましたが、以下の修正指示を加えた結果がこちらです。

修正指示:すべてのAWSリソース・構成がおさまるように描画エリアやレイアウトを最適な内容に調整したうえで、改めて構成図を書きなおしてください。

やはり通信経路まわりの間違いなど、修正すべき箇所は多いものの、それでもかなり頑張って描画しているほうだとは思います。

まとめ

まとめもGemini 3 Pro+Nano Banana Proに生成させてみました。

今回は、話題のGemini 3 ProとNano Banana Proを組み合わせて、AWS構成図の「読み書き」がどこまで可能かを検証しました。

  • 「読み」は優秀: 既存の構成図から概要を把握し、テキスト化する能力は高く、日本語OCRの精度も向上しています。
  • 「抽出・加工」はあと一歩: 特定の観点(セキュリティ、可用性など)に基づいて構成要素を抽出・加工する能力がある程度は備わっていますが、指示が通らないことも多く、実用にはあと一歩という印象です。
  • ゼロからの「書き」は発展途上: テキストやCloudFormationから新規に構成図を描き起こすことは可能ですが、特に通信経路の描画が苦手で、出力結果が安定しない「構成図ガチャ」の要素が強いです。修正指示を繰り返す手間を考えると、まだまだ人間が描いた方が早いと言えるでしょう。

結論として、現時点のGemini 3 Pro + Nano Banana Proは、手放しで完璧な構成図を生成してくれる魔法の杖ではありませんが、使い方次第ではエンジニアの作業をサポートしてくれる「アシスタント」となりそうです。特に、情報の整理や可視化のたたき台作成においては力を発揮するでしょう。

一方で、生成AIの進化速度は凄まじく、今回課題と感じた点も遠くない未来に解消される期待があります。 開催目前のAWS re:Invent 2025でも、AWSと生成AIを組み合わせた新しい発表があるかもしれません。引き続き最新動向をウォッチし、実務への適用を模索していきたいと思います。

最後までお読みいただきありがとうございました。

*1:決してダジャレではありません

*2:現在なら踏み台サーバの代わりにSSMセッションマネージャを利用したり、EC2もAuto Scalingグループ配下にAMIから構築してスケーラビリティを担保する構成が推奨されますが、まだまだ旧来型の構成の移行・運用保守案件も多く、最初の学習教材としてはちょうどいい構成

*3:「temperature」(生成AIに渡す初期パラメータのうち「ランダム性」)がかなり高い印象

*4:この検証、後半になってくるとだんだん修正指示を出すのが面倒になってきて、「自分で書いたほうが早い!」と思ってしまう場面もありました。修正を繰り返すと日本語の解像度も怪しくなってきたり、Nano Banana Proも無言で修正画像をパッと出してきたりして、「はいはい、これでいいんでしょ」みたいなちょっと険悪な空気を感じることも。。

椿山 俊和 (記事一覧)

エンタープライズクラウド本部 クラウドリライアビリティ1課

2025年5月に40代後半で中途入社。AWS認定資格全冠。好きなAWSサービスはLambdaとCloudFormation。好きな飲み物はコーヒーとプレモルです。