Claude Code更新 Managed Agents連携・autofix-pr・team-onboarding【4/5〜11】

記事タイトルとURLをコピーする

はじめに

サーバーワークスの池田です。

今週(4/5〜4/11)の Claude Code は v2.1.93 から v2.1.101 までの期間にリリースが行われました。Anthropic 側では 4 月 7 日に Claude Mythos Preview、4 月 8 日に Claude Managed Agents public beta と大きな発表が続いた週でもあります。Claude Code 本体でも、PR の CI エラーやレビューコメントをクラウド上で自動修正する /autofix-pr、ローカルの利用状況から新メンバー向けガイドを自動生成する /team-onboarding などが追加され、Claude Code が「エージェント実行基盤のエントリポイント」としての性格を強めた 1 週間でした。

この記事で分かること

  • Claude Managed Agents の概要と Claude Code からの呼び出し方
  • クラウド上で PR を自動修正する /autofix-pr の仕組みと使い方
  • タスク中に Opus へ相談できる /advisor(Advisor Tool)の狙いとベンチマーク結果
  • ローカル利用状況から新メンバー向けガイドを生成する /team-onboarding の使い方
  • /loop から /loops への刷新と動的スケジューリングの考え方
  • Google Vertex AI 接続ウィザード /setup-vertex の位置付け
  • Mythos Preview が示した異次元のベンチマークと Project Glasswing の全体像

今週の主要アップデート一覧

機能 バージョン 主な変更点 参照
Claude Managed Agents 連携 v2.1.93+ クラウドホスト型エージェント基盤 Managed Agents を Claude Code の claude-api スキル経由で構築・デプロイ可能に 公式ドキュメント
/autofix-pr v2.1.93+ ローカルセッションをクラウドに転送し、GitHub PR の CI エラーやレビューコメントを自動で修正 公式ドキュメント
/team-onboarding v2.1.93+ ローカルの CLAUDE.md・スキル・コマンド履歴から新メンバー向けオンボーディングガイドを自動生成 Changelog
/loops v2.1.93+ /loop/loops にリネームし、動的スケジューリングに対応 Changelog
/setup-vertex v2.1.98 Google Vertex AI 接続をウィザード形式で対話的に完了できるコマンド 公式ドキュメント

注目アップデート1 Managed Agents と Claude Code の連携

Managed Agents とは

4 月 8 日に Anthropic が Claude Managed Agents の public beta を発表しました。Managed Agents は、クラウドでホストされた Claude エージェントを構築・実行できる API 群で、サンドボックス実行、状態管理、認証情報の扱い、ツール実行といった基盤を Anthropic 側がまとめて管理します。開発者は自前で agent loop やツールランタイムを組む必要がなく、エージェントのロジックとプロンプト設計に集中できる形です。

Managed Agents は次の 4 つの概念で構成されています。

概念 役割
Agent 使うモデル、システムプロンプト、ツール、MCP サーバー、スキルをひとまとめにした定義
Environment エージェントが実行されるサンドボックス Linux 環境。インストール済みパッケージやネットワーク設定を含む
Session Agent と Environment を組み合わせて実行される実行インスタンス。会話履歴を保持
Events セッション中に流れてくる実行状況(思考、ツール呼び出し、出力)のストリーム

注目すべきは、この Managed Agents が Claude Code から直接呼び出せるように設計されている点です。Claude Code 最新版には built-in の claude-api スキル が同梱されており、セッション内で依頼するだけで、Managed Agents のオンボーディングフローに入って対話的にエージェントを組み上げられます。

Claude Code から Managed Agents のエージェントを作る手順

ここからは、Claude Code から実際にエージェントを 1 つ作ってデプロイするまでの流れを追っていきます。

ステップ1 claude-api スキルでオンボーディングを開始する

Claude Code を起動して、セッション内で「Claude API の Managed Agents のオンボーディングを始めて」のように依頼します。built-in の claude-api スキルが起動し、Managed Agents のオンボーディングドキュメント (managed-agents-onboarding.md) を読み込んで、対話的なインタビュースクリプトを走らせます。

claude-api スキルが起動し、プロジェクトの言語を自動判定したうえでパターン例を提示してくれます

ステップ2 パターンを選んでエージェントの構成を決める

claude-api スキルはまず Managed Agents の基本概念(Agent config / Environment config / Session)を簡潔に共有した後、プロジェクトの tsconfig.jsonsrc/ を読み取って言語を自動判定します。上のキャプチャでは TypeScript と判定され「コード例は TypeScript で出すよ」と宣言しています。

続けて「作りたいエージェントはもう決まってる?それとも、よくあるパターンを先に見てから決めたい?」と聞いてきます。参考としてパターン例のテーブルが表示されます。

パターン トリガー
Fire-and-forget PR 人間 Slack コマンド → エージェント(GitHub tool)→ CI 通る PR
リサーチ+ダッシュボード 人間 トピック → エージェント(web search + skill)→ HTML ダッシュボード
イベント駆動 Webhook GitHub PR push → エージェント → Slack 通知
スケジュール実行 Cron 日次ブリーフ → エージェント → Slack レポート

今回は スケジュール実行パターン をベースに、「天気を調べて Slack に通知するエージェント」を作ってみます。ここで Claude Code に打つ指示は、たとえば次のような自然言語で十分です。

スケジュール実行で、SlackのWebhookに今日の東京の天気をポストするエージェントを作りたい。

すると、スキルは 3 ラウンドの質問をまとめて投げてきます。ユースケースがシンプルなので、提案も変更したいところだけ伝えれば一括で回答できます。

  • Round A — ツール: Prebuilt Agent tools(agent_toolset_20260401)を有効化。MCP tools / Custom tools は不要
  • Round B — スキル・ファイル・リポジトリ: すべて不要(天気取得 + Slack 投稿はビルトインツールだけで完結)
  • Round C — 環境・アイデンティティ: ネットワーク unrestricted、エージェント名 "Tokyo Weather Reporter"、モデル claude-haiku-4-5(コスト効率重視)

3 ラウンドの質問をまとめて提示。ユースケースがシンプルなので一括で回答できます

ステップ3 コードが自動生成される

構成が固まると、claude-api スキルは 2 つの TypeScript ファイルを生成します。プロジェクトの言語を自動判定して TypeScript が選ばれましたが、Python / cURL でも出力できます。

Block 1: setup.ts — 初回セットアップ(1 回だけ実行)

Environment と Agent を作成し、得られた ID を .env に保存するスクリプトです。Agent の system プロンプトには「web_search で東京の天気を調べ、日本語で要約し、curl で Slack Webhook URL に POST する」という指示が入ります。モデルは claude-haiku-4-5 が選ばれ、コスト効率よく動く設計です。

setup.ts — Environment と Agent を作成し、ID を .env に保存します

Block 2: run.ts — ランタイム(毎回の実行 = cron から呼ばれる)

.env から Agent ID / Environment ID / Slack Webhook URL を読み込み、Session を作成してストリーム出力を受け取るスクリプトです。重要なのは、Slack Webhook URL はキックオフメッセージ経由でエージェントに渡す設計になっている点です。URL をコンテナの環境変数に埋め込むのではなく、ホスト側で管理してメッセージとして渡すことで、機密情報がサンドボックス内に残らないパターンです。

run.ts では .env から ID と Slack Webhook URL を読み込み、Session を作成してイベントストリームを消費します。イベントストリームの各タイプ(agent_message / session_error / session_status_terminated / session_status_idle)をハンドリングし、最後にセッションをアーカイブしてクリーンアップする処理が入ります。

イベントハンドリングとクリーンアップ、そして cron 登録までの使い方が一気に出力されます

ステップ4 実行してみる

コード生成が完了すると、package.json にも agent:setupagent:run のスクリプトが追加され、ファイル構成のまとめと実行手順が表示されます。

agents/tokyo-weather/ 配下に setup.tsrun.ts が生成され、package.json にもスクリプトが追加されます

生成されたファイル構成は以下の通りです。

agents/tokyo-weather/
├── setup.ts   # 1回だけ実行 → Agent + Environment を作成
└── run.ts     # 毎回実行 → Session 作成 → 天気取得 → Slack投稿

実行手順もスキルが案内してくれます。

  1. セットアップ(1 回だけ): export ANTHROPIC_API_KEY=sk-ant-xxxnpm run agent:setup — Agent と Environment が作成され、AGENT_ID / AGENT_VERSION / ENVIRONMENT_ID が出力される
  2. .env を設定: 出力された ID に加えて SLACK_WEBHOOK_URL を記入
  3. テスト実行: npm run agent:run — エージェントが天気を検索し、Slack に投稿される
  4. cron に登録(例: 毎朝 8 時): 0 8 * * * cd /path/to/ccblog && npx tsx agents/tokyo-weather/run.ts

実際にやってみます。まず npm run agent:setup を実行すると、Agent と Environment が作成されて ID が出力されます。

npm run agent:setup で「Tokyo Weather Reporter」が作成されました。ID とバージョンが出力されるので .env に保存します

次に .envSLACK_WEBHOOK_URL を設定して npm run agent:run を実行すると、Session が作成され、エージェントが web_search で天気情報を取得して Slack に投稿します。

npm run agent:run を実行。Web 検索で天気を取得し、「Slack に届いてるはず」と表示されました

Slack を確認すると、実際に天気予報が投稿されていました。

Slack に届いた天気通知。気温・降水確率に加えて花粉情報や注意報まで含まれています

Claude Code のセッション内で指示を出すだけで、Managed Agents の Agent 定義からランタイムスクリプト、package.json 更新、cron 登録手順まで一気通貫で生成され、実際に動くところまで確認できました。あとは cron に登録すれば毎朝自動で天気予報が Slack に届く仕組みの完成です。

ant CLI でも同じことができる

Claude Code 経由の作成フローに加えて、Anthropic は Managed Agents 向けの新しい CLI ant を同時にリリースしました。

brew install anthropic-cli
ant --version

ant は Agent → Environment → Session → Events というメンタルモデルをそのままコマンドラインにマッピングしたもので、CI / CD パイプラインやサーバーサイドスクリプトからエージェントを作成・起動・監視する用途に向きます。Claude Code からの対話的な作成フローが「初回の試行錯誤に向いている」のに対して、ant は「本番デプロイの自動化」に向いているイメージです。

Claude Code SDK から Claude Agent SDK へ

Managed Agents のリリースに合わせて、これまで Claude Code SDK と呼ばれていた開発者向け SDK が Claude Agent SDK にリネームされました。Agent SDK は Claude Code と同じ agent loop・ツール・コンテキスト管理を Python / TypeScript から直接利用できるもので、Managed Agents 利用時に必要なベータヘッダ managed-agents-2026-04-01 も SDK 側が自動で設定してくれます。

このリネームは単なる名称変更ではなく、Claude Code がコーディング特化のツールという立ち位置から、Managed Agents を含むエージェント実行基盤全体のエントリポイントへ再定義されたことを示しています。

料金と初期ユーザー

料金モデルはトークンの標準レートに加えて、セッション実行時間 1 時間あたり $0.08 が課金されます。長時間の自律実行を前提とした料金設計になっており、ロングランニングなエージェントワークロードを想定していることがうかがえます。初期ユーザーには Notion、楽天、Asana といった企業の名前が公式発表で紹介されており、エンタープライズ領域での活用が先行しています。

注意点・制約

  • 現時点で public beta のため、仕様やエンドポイント、料金は変動する可能性があります
  • Managed Agents 関連のエンドポイントは managed-agents-2026-04-01 ベータヘッダが必須です(Agent SDK 利用時は自動設定)
  • 既存の自作統合で直接 API を叩いている場合は、ベータヘッダの追加が必要になる場合があります
  • 環境設定で許可したネットワーク範囲・ツール・認証情報がエージェントの権限となるため、本番投入前に Environment の設定をレビューしておく必要があります

注目アップデート2 /autofix-pr でPR をクラウドに預けて自動修正する

今週追加された /autofix-pr は、GitHub の Pull Request に入る CI エラーやレビューコメントを、クラウド上の Claude Code セッションが自動で修正してくれるコマンドです。ローカルで PR ブランチの作業を終えた後に /autofix-pr を実行すると、gh 経由で対象の PR を検出し、クラウド上に新しい Web セッションをスポーンして auto-fix を有効化します。クラウド側のセッションが GitHub のイベント(CI 失敗、レビューコメント)をポーリングし、新しいイベントを検知すると原因を調査して fix コミットを push します。

修正の判断は状況に応じて切り替わります。typo や lint エラーのように意図が明確な指摘はそのまま修正をコミットし、アーキテクチャに踏み込むような曖昧な依頼に対しては確認を求めて停止します。CodeRabbit のようなレビュー bot のコメントにも反応するため、レビュー bot と /autofix-pr の組み合わせで PR の自動ループを回す運用も視野に入ります。

利用には以下の前提があります。

  • Claude GitHub App がリポジトリにインストールされていること
  • Claude Code on the Web が有効なアカウント(Pro / Max / Team プラン、Enterprise はプレミアムシート)
  • 対象ブランチに GitHub PR が存在していること

未インストールの場合、/autofix-pr 実行時に GitHub App のインストールリンクが表示され、セットアップを促されます。注目アップデート 1 で紹介した Managed Agents と同じ「クラウドで長時間走るエージェントに作業を預ける」設計の延長線上にある機能です。


今週の新コマンド

/advisor でタスク中に上位モデルへ相談する

/advisor は、タスク実行中の重要な判断ポイントで より強いモデル(Opus)にリアルタイムで相談できる機能です。Claude Code 上で /advisor を実行すると Advisor Tool のオン・オフを切り替えられます。

通常、Claude Code は Sonnet のような高速・低コストなモデル(エグゼキューター)でタスクを処理します。Advisor Tool を有効にすると、エグゼキューター自身が「ここは判断が難しい」と判断した局面で自動的に Opus(アドバイザー)を呼び出し、会話全体の履歴を丸ごと転送して助言を仰ぎます。パラメータは不要で、呼び出しはエグゼキューター側が自律的に行います。

/advisor [opus|sonnet|off] でアドバイザーモデルを選択できます

/advisor opus を実行すると「Advisor set to Opus 4.6」と表示されます

実際に PR のレビューで使ってみると、エグゼキューターが PR の情報を取得した後に「Advising using Opus 4.6」と表示され、Opus がバックグラウンドで思考して助言を返す様子が確認できます。

PR #3 の情報を取得後、Opus 4.6 がアドバイザーとして思考している様子

Anthropic の公式ベンチマークによると、Sonnet + Opus アドバイザーの組み合わせは SWE-bench Multilingual で +2.7pt のスコア向上を達成しつつ、タスクあたりのコストを 11.9% 削減しています。強いモデルに全投げするよりも、必要なときだけ相談する方がコスト効率と精度の両方で優れるという結果です。

Managed Agents や /autofix-pr と組み合わせると、「普段の作業は Sonnet + Advisor(Opus)で回す → 重い作業は Managed Agents に預ける → PR の後始末は /autofix-pr に任せる」という階層的なエージェント運用が見えてきます。

/team-onboarding でチームのオンボーディングガイドを生成する

/team-onboarding は、ローカル環境での Claude Code 利用状況を集約し、新しいチームメンバー向けのオンボーディングガイドを自動生成するコマンドです。実行すると、直近 30 日間の利用履歴を分析し、ワークスペースの構成やプロジェクト構造を確認したうえでガイドのドラフトを作成します。

/team-onboarding を実行すると、30 日分の利用履歴をもとにオンボーディングガイドの生成が始まります

生成されたガイドには、作業タイプの内訳(Build Feature / Debug / Fix / Plan & Design / Prototype の割合)やよく使うスキル・コマンドのランキングなどが含まれます。チームの使い方がデータで可視化されるため、新メンバーが「このプロジェクトでは Claude Code をどう使っているのか」を具体的に把握できます。

生成されたガイドのドラフト。作業タイプの内訳やよく使うコマンドが自動集計されています

挙動は CLAUDE_CODE_TEAM_ONBOARDING 環境変数で制御できます。CLAUDE.md やスキルが整理されているプロジェクトほど、生成されるガイドの精度は高くなります。「自分の使い方を後任に引き継ぎたい」「チームで Claude Code を本格的に使い始めるタイミング」に合うコマンドで、開発マネージャーやテックリードにとって使いどころの多い機能です。

/loops で動的スケジューリングに対応する

これまで /loop(単数形)として提供されていたスケジュール実行機能が、今週 /loops(複数形)にリネームされ、動的スケジューリングに対応する形に刷新されました。

従来の /loop は固定的なインターバルでプロンプトを再実行するイメージでしたが、/loops では次の実行タイミングを Claude 自身がタスクの状態に応じて決める動的スケジューリングが前提になっています。定期的に走らせたい処理(コード品質の監視、依存関係チェック、テスト失敗の要約、リリースノートの更新など)をまとめて任せる用途に向きます。/schedule から /loops への移行は、「固定スケジュール」から「コンテキスト駆動の自律実行」への方向転換として読むとわかりやすいと思います。

/setup-vertex で Google Vertex AI 接続をウィザード化

v2.1.98 で追加された /setup-vertex は、Google Cloud Vertex AI 経由で Claude Code を使う際の接続設定を、ウィザード形式で対話的に完了できるコマンドです。先週(Week9)紹介した /setup-bedrock の Vertex AI 版と考えると位置付けがつかめます。

ウィザードは GCP プロジェクトとリージョンを検知し、そのプロジェクトから呼び出せる Claude モデルを確認したうえで、モデルのピン留めまで自動で進めてくれます。結果は ~/.claude/settings.jsonenv ブロックに書き込まれるため、自分で CLAUDE_CODE_USE_VERTEX などの環境変数を export する必要はありません。GCP 側の事前準備(プロジェクト作成、IAM 権限、Claude モデルの有効化)は利用者が済ませておく必要があります。

初回セットアップ時は claude 起動後のログイン画面で 3rd-party platformGoogle Vertex AI を選ぶことでもウィザードを呼び出せます。詳細は公式ドキュメントの Vertex AI ページを参照してください。

その他の変更点

変更点 バージョン 参照
claude-opus-4-6 / claude-sonnet-4-0 の識別名を CLI 内部定義に追加。既存の Opus 4.6 / Sonnet 4 モデルに対するエイリアスとして扱われる v2.1.93+ Changelog
Managed Agents 基盤向けの新環境変数 ANTHROPIC_BEDROCK_MANTLE_API_KEY / ANTHROPIC_BEDROCK_MANTLE_BASE_URL / CLAUDE_CODE_USE_MANTLE / CLAUDE_CODE_SKIP_MANTLE_AUTH を追加 v2.1.93+ Changelog
カスタム証明書ストア指定用の CLAUDE_CODE_CERT_STORE 環境変数を追加。社内CAなどの独自証明書を使う環境向け v2.1.93+ 公式ドキュメント
コンテキストトークン上限を上書きする CLAUDE_CODE_MAX_CONTEXT_TOKENS 環境変数を追加 v2.1.93+ Changelog
Perforce 連携モードを有効化する CLAUDE_CODE_PERFORCE_MODE 環境変数を追加 v2.1.93+ 公式ドキュメント
サンドボックス内実行を示す CLAUDE_CODE_SANDBOXED / スクリプト制約用の CLAUDE_CODE_SCRIPT_CAPS / MCP allowlist 制御用の CLAUDE_CODE_MCP_ALLOWLIST_ENV を追加 v2.1.93+ Changelog
チームオンボーディング機能の制御フラグ CLAUDE_CODE_TEAM_ONBOARDING 環境変数を追加 v2.1.93+ Changelog
WSL2 サンドボックスの制約をドキュメントに追記。サンドボックス内から cmd.exe / powershell.exe / /mnt/c/ 配下の Windows バイナリは起動できない(必要なら excludedCommands で除外して実行) v2.1.93+ 公式ドキュメント
スキル内の複数行シェル実行記法 ```! のドキュメントを追加。スキルファイル内でフェンスブロック形式のコマンドをまとめて実行できる書式を明文化 v2.1.93+ 公式ドキュメント
/voice コマンドの内部定義を local から text タイプに変更 v2.1.93+ Changelog
/buddy コマンドを削除。エイプリルフール(4/1)限定機能として役目を終えた v2.1.93+ Changelog
/loop コマンドを /loops にリネーム・統合 v2.1.93+ Changelog

まとめ

ここまで紹介してきた通り、今週の Claude Code は /autofix-pr や Managed Agents 連携など、エージェント実行基盤のエントリポイントとしての性格を強める更新が続きました。

Claude Code 本体の変更に加えて、今週は Anthropic 自体からも「もうひとつの衝撃的な発表」がありました。それが 4 月 7 日に公開された Claude Mythos Preview です。そして結論から言うと、この Mythos のスコアは これまでの Claude の進化ペースとは明らかに次元が違うレベルでした。

Claude Opus シリーズの SWE-bench Verified 推移

Claude Opus の各バージョンが SWE-bench Verified でどう推移してきたかを並べると、Mythos の飛躍の異常さが一目で分かります。

モデル リリース時期 SWE-bench Verified 前バージョン比
Claude Opus 4 2025年5月 72.5%
Claude Opus 4.1 2025年8月 74.5% +2.0pt
Claude Opus 4.5 2025年11月 80.9% +6.4pt
Claude Opus 4.6 2026年2月 80.8% −0.1pt
Claude Mythos Preview 2026年4月7日 93.9% +13.1pt

Opus 4 以降の上昇幅を見ると、+2.0pt、+6.4pt、−0.1pt と徐々に頭打ちになっていたことが分かります。特に 4.5 から 4.6 への変化ではコーディング性能がほぼ横ばい(−0.1pt)となり、「80% の壁はしばらく超えられないのではないか」と見られていたのが実情です。Sonnet 側でも 4.5 → 4.6 は 77.2% → 79.6% と +2.4pt に留まっており、Claude 4 系全体として性能の伸びが鈍化している状況でした。

そこに登場したのが Mythos Preview で、前モデルから一気に +13.1pt の飛躍を見せ、初めて 93.9% に到達しました。ここ 1 年間の Claude の進化ペースからすると、単なる世代交代では説明できない跳ね上がり方です。

ベンチマークがサチュレートするレベルの性能

Anthropic が公開した Mythos Preview の技術資料では、他のベンチマークでも同じ傾向が確認できます。SWE-bench Pro(実務寄りのコーディング)は Opus 4.6 の 53.4% に対し Mythos は 77.8%、スクリーンショット理解を含む SWE-bench Multimodal では 27.1% から 59.0% と 2 倍以上の開きがつきました。CyberGym(脆弱性再現)では 66.6% → 83.1% と、どのベンチマークでも直近世代を大きく引き離しています。Anthropic 自身が「既存ベンチマークがサチュレートしたので、新しい評価軸を用意する必要がある」と述べるほどの性能差です。

特に象徴的なのが Mozilla Firefox の既知・未知の脆弱性を対象にした実世界テストです。Claude Opus 4.6 が実際に動作する exploit を作成できる確率はほぼ 0% に近かったのに対し、Mythos Preview は 181 回 working exploit の作成に成功しました。ベンチマーク上の数字の違いが、実際のセキュリティ能力の差としてそのまま出ている形です。

Project Glasswing と限定公開

この性能ゆえに、Mythos Preview は一般公開されません。代わりに Anthropic は、主要な IT・クラウド・セキュリティ企業と共同で Project Glasswing という取り組みを立ち上げ、Mythos を使って既存ソフトウェアの脆弱性を先回りして特定・修正するフェーズに入りました。Anthropic を含む以下の 12 組織が初期パートナーとして名を連ねています。

  • Amazon Web Services
  • Anthropic
  • Apple
  • Broadcom
  • Cisco
  • CrowdStrike
  • Google
  • JPMorgan Chase
  • Linux Foundation
  • Microsoft
  • NVIDIA
  • Palo Alto Networks

Anthropic の発表では、Mythos が既に数千件の高深刻度の脆弱性を発見しており、その中には 10 年以上前から存在していた未発見のバグも含まれると説明されています。「世界中のあらゆるコンピュータに存在する脆弱性を、攻撃者より先に塞ぐ」という方向性で、Project Glasswing はそのための招待制プログラムという位置付けです。

Claude Code はどうつながるのか

現時点では Mythos Preview を Claude Code から呼び出す公式な手段は提供されていません。しかし、今週 Claude Code に入った Managed Agents 連携と Claude Agent SDK を踏まえると、Claude Code は将来 Mythos クラスのモデルを呼び出す最も自然なエントリポイントになる可能性が高いと見ています。もしそうなれば、/autofix-pr による CI エラーの自動修正にとどまらず、依存ライブラリの脆弱性発見やセキュアコードレビューまで、1 つのセッションで完結できる世界が現実的になってきます。

今週の更新を振り返ると、「クラウド上で長時間走るエージェントに作業を預け、結果を受け取る」という形への移行がより鮮明になりました。/autofix-pr と Managed Agents が示したのは「Claude Code が常駐エージェントのフロントエンドになる」方向性で、Mythos Preview が示したのは「そのエージェントに載るモデルが、数カ月前の常識を吹き飛ばすレベルで進化している」という現実です。Mythos のような特殊モデルが将来 Claude Code から自然に呼び出せる日が来たとき、脆弱性対策とコーディングの景色はまったく別のものになっているかもしれません。