RAGの精度向上がお手軽に！Amazon Bedrock のKnowledge BasesでAdvanced RAG機能がリリースされました

サーバーワークスの村上です。

2024年7月10日に行われたAWS New York Summitで生成AI関連のアップデートがいくつかありました。

ナレッジベース関連でも激アツなアップデートがあり、このブログではAdvanced RAG機能について紹介させていただきます。

追加のデータソースをサポート (プレビュー)
- S3以外にもウェブクローラなど追加のデータソースを選択可能に
Advanced RAG機能をサポートするようになりました
- チャンク化のオプションがより充実し、精度向上に寄与

RAGとは
Advanced RAGとは
チャンクとは
今回リリースされたチャンク戦略
Hierarchical chunking（階層的チャンク化）を試してみた
所感

RAGとは

ユーザーの質問に関連する情報を検索し、検索してきた情報をプロンプトに含める手法です。

こうすることで大規模言語モデル（LLM）が知らない事項についても回答を生成させることが可能です。

詳細は過去のブログでもご説明しています。

blog.serverworks.co.jp

Advanced RAGとは

通常のRAG（Naive RAG）に対して、精度向上のために追加の工夫を加えたRAGをAdvanced RAGと表現します。

一般的にどのような工夫の手法があるかについては、AWSブログにて説明されています。

Advanced RAG の枠組みでは、検索前処理 (pre-retrieval) と検索後処理 (post-retrieval) としてさまざまな工夫が考案されています。検索前処理では、インデックス構造の最適化やクエリの改善を行います。検索後処理では、検索結果のランク付けや情報の圧縮を行い、大規模言語モデル (LLM) への入力を最適化します。
Amazon Kendra と Amazon Bedrock で構成した RAG システムに対する Advanced RAG 手法の精度寄与検証 | Amazon Web Services ブログ

チャンクとは

チャンクは検索対象ドキュメントを小さな単位に分割したものです。

LLMが正しい回答を生成するために理想的なLLMへの入力は、ユーザーの質問と質問に答えられるために必要かつ適切な量の情報です。

ユーザーの質問に加え、膨大な量の検索対象ドキュメントすべてをLLMに入力すると、コストがかかるだけでなくハルシネーションの原因にもなり得ます。

そのため、検索対象ドキュメントをさらに分割する必要があるわけです。

今回リリースされたチャンク戦略

下記3つのオプションが追加されました。

チャンク戦略	説明
セマンティックチャンク化（Semantic chunking）	意味的に類似したチャンクを編成する
階層的チャンク化（Hierarchical chunking）	ネストされた親子チャンクを編成する
カスタムチャンク化	ユーザー独自のチャンク化コードを Lambda 関数として記述できる