こんにちは、久保(賢)です。
2025年10月、QuickSightがQuick Suiteに進化し、BI機能に加えて様々なAI機能が利用可能となりました。
本記事では、Quick Suiteでインターネット情報を利用したいケースにおいて、Quick Suiteのインテグレーションから利用可能なWebクローラを使用した結果を共有いたします。
- やってみたいこと
- Quick SuiteのWeb検索機能の現状(2025年11月時点)
- 代替手段: インテグレーション機能の利用
- Webクローラの利用
- おわりに
- 参考情報: AWSのその他のWebクローラ
やってみたいこと
秋から冬に変わりゆく現在、インフルエンザの流行が気になる季節となりました。
インフルエンザの流行情報をインターネットから収集することで、最新の情報に基づいたBIの予測に利用することができるかもしれません。
Quick SuiteのWeb検索機能の現状(2025年11月時点)
Quick Suiteの各機能では、Web Searchの機能(以後Web検索)が利用可能となっています。
この機能を有効化することで、AIエージェントがインターネットから最新情報を取得し、回答に反映することが可能となります。
チャットエージェント

フロー

研究

ただし、2025年11月14日現在では、Web検索機能は日本語圏の情報検索には最適化されていないようなので、日本語での検索でも主に米国のサイトが検索される傾向にありました。
AWS Regions, websites, IP address ranges, and endpoints - Amazon Quick Suite
上記ドキュメントに記載の内容の抜粋です。
Amazon Quick Suite web search capability is securely hosted in the US East (N. Virginia) AWS Region. While Amazon Quick Suite is available in multiple regions, all web search queries are processed through the web search service in the US East region.
Web検索はすべて米国東部(バージニア北部)リージョンで処理されているため、日本語圏の情報検索が現時点では期待した結果が得られにくい状況となっています。
AWSサポートへも確認したところ、残念ながらやはり認識通りとのことでした。今後の改善が期待されます。
具体的には、日本国内のWebサイトや記事を検索してほしいところ、実際には米国内のサイトや記事しか検索されない、という動作になります。
例えば弊社サーバーワークスの代表者が誰か?を検索してもらおうとすると、弊社のサイトは参照されず、米国内の企業情報や企業コンタクト情報を元に誤った情報を返してしまう、ということが起こります。
代替手段: インテグレーション機能の利用
Quick Suiteでは、外部データソースと連携するためのインテグレーション機能が提供されています。
このインテグレーション機能を利用して、Webクローラを追加することで、インターネット上の情報を収集し、Quick Suiteで利用してみました。
インテグレーション
Quick Suiteの画面の左下にある「インテグレーション」から、様々な外部データとの統合を追加することが可能です。

2025年11月14日現在では、以下のようなインテグレーションが利用可能となっています。

Web情報活用の選択肢
インテグレーションのうち、Web情報を収集するために利用できそうなものとして、以下の2つがあります。
- MCP
- Webクローラ(Webcrawler)
MCPの場合はリモートMCP限定となりますが外部のMCPサーバを統合することが可能です。
例えばTavilyのリモートMCPを利用することで、インターネット上の情報を収集し、Quick Suiteで利用することが可能となります。
本記事では、Webクローラを利用してみました。

Webクローラの利用
対象サイト
今回は、国立感染症研究所が提供しているインフルエンザ流行情報のページを対象としました。
インフルエンザ(鳥インフルエンザ及び新型インフルエンザ等感染症を除く。)|国立健康危機管理研究機構 感染症情報提供サイト
こちらのサイトでは"インフルエンザ疫学情報速報"として、直近6週間の週ごとのインフルエンザ感染報告数のExcelとPDFが提供されています。
Excelは以下のような形式で、日本の合計と都道府県別の感染報告数が掲載されています。

シンプルなWebスクレイピングの場合はExcelを取得することは難しいですが、Quick SuiteのWebクローラはExcelファイルの内容も取得することが可能です。
特に自動クロールを禁止している場合は、クロールを行わないようにしてください。
本記事で紹介している国立感染症研究所のサイトの利用規約は以下のURLから確認できます。
https://id-info.jihs.go.jp/usage-contract.html
なお、Quick SuiteのWebクローラはrobots.txtを尊重するようになっています。
https://docs.aws.amazon.com/quicksuite/latest/userguide/web-crawler-integration.html
Webクローラの設定
対象サイトに示したURLのみをクロールするように設定しました。
なお、depth(リンクを辿る深さ)はデフォルトの1のままとしました。2以上にすると不要なリンクまで辿ってしまう可能性があるためです。ご注意ください。

Refresh reportsのタブをクリックすると、クロールの結果を確認することができます。
Excel、PDFが追加されていることがわかります。

Quick Suiteでの利用
チャットエージェントに当該ナレッジベースをデータソースとして割り当てます。

直近のインフルエンザの定点当たり報告数について質問してみます。

想定通りの週ごとのExcelから最新の全国の数値を取得しています。 さらに過去5週間に渡る各Excelから値を抽出できています。

レスポンスイベントを展開することでAIエージェントの動作過程を確認できます。

Quick Suiteはソースデータから「定当」が定点当たり報告数であることを理解し、さらに「総数」を全国の値であると認識して「6.29」という値を正しく取得できています。
続いて北海道に絞って聞いてみます。

過去5週ではなく4週になっていますが、北海道についても正しい数値を返しました。
全国の値についてグラフ化を依頼してみます。
これは失敗しましたが、再作成をお願いしたところ成功しました。

Webクローラがインデックスした情報を元に内容を理解し、ユーザの質問に対して正しい数値を返すことができました。
さらにグラフ化も可能であることがわかりました。
なお、Webクローラはデフォルトでは1日に1回自動クロールされるため、データが自動的に最新化されていきます。
今回はチャットエージェントに対して利用しましたが、インテグレーションで作成したナレッジベースはフローや研究に対しても同様に利用可能です。
例えばフローに組み込むことで、最新のインフルエンザ流行情報を元にしたBIレポートの自動生成なども可能になります。
おわりに
Quick SuiteのWebクローラを利用することで、インターネット上の情報およびExcelなどのファイルからも情報を取得し、チャットエージェントで活用できるかどうかを試してみました。
以下ができることがわかりました。
- Webクローラによるナレッジベースの作成
- ナレッジベースを利用した生成AIによるチャット応答
- Quick Suiteの機能によるグラフ表現の提供
今回はシンプルなクロールでしたがQuick SuiteのWebクローラ統合では各種認証への対応も可能になっていますので、社内イントラネットの情報をクロールすることも可能かと思います。
詳細はこちらのドキュメントを参照ください。
参考情報: AWSのその他のWebクローラ
AWSでは他にも、Amazon Bedrock ナレッジベースやAmazon KendraにもWebクローラの機能があります。
Amazon Bedrock ナレッジベース
Amazon Bedrock ナレッジベースにもWebクローラが存在しますが、2025年11月現在はプレビュー状態です。
そして実際に試してみたところ、Excelファイルについては The type of document/content item is not supported. というエラーで取得できませんでした。

Amazon Kendra
Web CrawlerのV2.0で検証しましたが、 KendraのWebクローラはExcelファイルの取得に対応していました。

Include the files that has links to web pagesをオンにすることでサイトに掲載されているExcelファイルをKendraに取り込むことが可能です。

KendraはQuick Suiteよりもかなり詳細にクロールの設定が可能です。
Amazon Kendra Web Crawler connector v2.0 - Amazon Kendra
久保 賢二(執筆記事の一覧)
猫とAWSが好きです。