Amazon BedrockでClaude 3 Opusが利用可能になりました

記事タイトルとURLをコピーする

サーバーワークスの村上です。

Amazon BedrockでClaude 3 Opusが利用可能になったというアップデートがありました。

aws.amazon.com

これでClaude 3ファミリーすべてがAmazon Bedrockで利用可能になりました。

このブログではあらためてClaude 3 ファミリーの精度・速度・料金について整理させていただきます。

利用可能なリージョン、一般提供が開始された時期

利用可能なリージョンは2024年4月16日時点の情報です。

モデル 一般提供開始日 リージョン
Claude 3 Haiku 2024 年 3 月 14 日 バージニア北部、オレゴン、シドニー、パリ
Claude 3 Sonnet 2024 年 3 月 4 日 バージニア北部、オレゴン、シドニー、パリ
Claude 3 Opus 2024 年 4 月 16 日 オレゴン

今回のClaude 3 Opusの一般提供開始まで若干期間が空いているものの、本家のAnthropic社のClaude 3ファミリーのリリースが2024年3月4日でしたので、スピーディにAmazon Bedrockでも利用可能になったと言えます。

精度・速度

モデル 特徴
Claude 3 Haiku 高速・低コスト
Claude 3 Sonnet Claude 2 および Claude 2.1 よりも2倍高速
Claude 2 および Claude 2.1 と同じレベルのインテリジェンス
Claude 3 Opus Claude 2 および Claude 2.1 と同様の速度
Claude 2 および Claude 2.1 よりも推定2倍の精度向上

※表現はAnthropic社のリリースClaude 3 Sonnet 一般提供開始時のAWSブログClaude 3 Opus 一般提供開始時のAWSブログより抜粋

他モデルとの比較

以下はAnthropic社のリリースより転載した、他のモデルとの比較です。

GPT-4と比較しても同等レベルの精度であることが分かります。

料金

Anthropoc models 1,000入力トークンあたりの料金 1,000出力トークンあたりの料金
Claude Instant $0.00080 $0.00240
Claude 2.0/2.1 $0.00800 $0.02400
Claude 3 Haiku $0.00025 $0.00125
Claude 3 Sonnet $0.00300 $0.01500
Claude 3 Opus $0.01500 $0.07500

※オレゴンリージョンの料金 ※最新の情報は料金ページをご確認ください:Build Generative AI Applications with Foundation Models - Amazon Bedrock Pricing - AWS

動作確認(Opusは比喩表現も理解できた)

以前のブログでは弊社、大石社長の「今日のセッションで皆さまに何も得るものが無ければ切腹します」というプレゼンの画像を拾ってきて、Claude 3 Sonnetになんて書いてあるか判断してもらいました。

Claude 3 に画像内の文字を聞いてみました

blog.serverworks.co.jp

その際は以下のように出力され、正確に画像内の文字を理解し回答してくれたものの、物騒な表現だと心配されました。

この画像には、日本語で"切腹します"と書かれています。これは非常に深刻な内容を示しており、自殺を示唆する表現です。こうした言葉は決して軽々しく使うべきではありません。もし誰かがこのような言葉を口にしたり、自殺の兆候を示したりした場合は、専門家の助けを求めるべきです。一人一人の命は尊ばれるべきで、適切な支援を受ける必要があります。この画像の背景や意図は分かりませんが、自殺を扱うことは非常にデリケートな問題です。

今回はClaude 3 HaikuとClaude 3 Opusに対して同じ質問をしてみました。

するとClaude 3 Opusでは以下のように回答が生成され、切腹を比喩表現だと理解していることが分かります。

画像には日本語で以下のように書かれています。

「今日のセッションで皆さまに何も得るものが無ければ切腹します」

この文は講演者が聴衆に対して、このセッションから何かを得てもらえるよう全力を尽くすという強い決意を表しているように見えます。「切腹」というのは武士が責任を取る際の儀式的な自害行為を指しますが、ここでは比喩的に使われていると思われます。

一方でClaude 3 Haikuは比喩表現だとは思っていないようです。しかし回答生成のスピードは圧倒的に早かったです

生成スピードのイメージは以下の動画を見ていただきたいですが、プレイグラウンドのCompareモードで試しているので回答がストリーミング出力されていないです。本来なら回答をストリーミング出力することができるので、体感の待ち時間は少なくなる点をご留意ください。

youtu.be

以上です。最後まで読んでいただきありがとうございます!

村上博哉 (執筆記事の一覧)

2020年4月入社。機械学習が好きです。記事へのご意見など:hiroya.murakami@serverworks.co.jp