S3をファイルサーバー的に使えるAWSサービスを整理してみた

記事タイトルとURLをコピーする

はじめに

こんにちは!勝部です。

今回は「Amazon S3のデータを、ファイルシステムとしてマウントして使いたい」というニーズに応えるAWSサービスを整理してみました。

2026年4月にAmazon S3 Filesが一般提供されたことで、S3バケットをファイルシステムとしてマウントする選択肢がまた一つ増えました。

ただ、似たようなサービスが複数あって「結局どれを使えばいいの?」と迷う方も多いのではないでしょうか。

実際私も最近この辺のサービスの使い分けに混乱してきていたので、整理してみました。

対象サービス一覧

今回取り上げるのは以下の5つのサービスです。

  • Amazon S3 Files(以下、S3 Files)
  • Mountpoint for Amazon S3(以下、Mountpoint for S3)
  • AWS Storage Gateway(Amazon S3 File Gateway)
  • Amazon FSx for Lustre(以下、FSx for Lustre)
  • Amazon FSx for NetApp ONTAP(以下、FSx for ONTAP)

いずれも「S3上のデータをファイルシステムのインターフェースでアクセスできる」という共通点がありますが、アーキテクチャやユースケースはそれぞれ異なります。

比較表

項目 S3 Files Mountpoint for S3 S3 File Gateway FSx for Lustre FSx for ONTAP
主なユースケース 汎用ファイルアクセス
ML/AI、チーム共有
大規模データの
読み取り中心ワークロード
オンプレからS3へのファイルアクセス HPC、ML
大規模バッチ処理
エンタープライズNAS移行
接続元コンピュート EC2
Lambda
ECS
EKS
EC2
ECS
EKS
オンプレ
EC2
EC2
ECS
EKS
オンプレ
EC2
ECS
EKS
オンプレ
接続元OS Linux Linux Linux
Windows
Linux Linux
Windows
macOS
対応プロトコル NFS FUSE NFS
SMB
Lustre
(POSIX)
NFS
SMB
iSCSI
プライマリストレージ S3 S3 S3 FSx
(S3と連携)
FSx
(S3に自動階層化)
書き込み
(新規作成のみ)
マネージド度 フルマネージド クライアントツール ハイブリッド
(GWアプライアンス)
フルマネージド フルマネージド
コスト 低〜中
(S3料金+FS I/O)

(S3料金のみ)
低〜中
(GW月額+S3料金)

(専用FS)

(専用FS)

各サービスの解説とユースケース

Amazon S3 Files

S3バケットをNFSファイルシステムとしてマウントできるサービスです。
内部的にはAmazon EFSの技術基盤を使用しており、S3のオブジェクトストレージとしての利便性と、EFSのファイルシステムとしての低レイテンシを両立させています。

特徴的なのは、データの実体がS3バケットに残り続ける点です。
ファイルシステム経由で書き込んだデータはS3バケットに自動同期され、S3 API経由でもアクセスできます。
逆に、S3 APIで追加したオブジェクトもファイルシステム側に反映されます。

数千のコンピュートから同時接続でき、EC2、Lambda、EKS、ECSからマウント可能です。

■ イメージ図

■ ユースケース

  • ML/AIのデータ準備パイプライン
  • チームでのデータ共有・共同作業
  • S3データに対するファイルベースのアプリケーション実行

■ 参考情報

aws.amazon.com blog.serverworks.co.jp

Mountpoint for Amazon S3

S3バケットをLinuxのローカルファイルシステムとしてマウントできるオープンソースのFUSEクライアントです。 AWSが開発・メンテナンスしています。

他4点との大きな違いは、マネージドサービスではなくクライアントツールである点です。
EC2インスタンスなどにインストールして使います。

高スループットに最適化されており、大規模データの読み取りに強いです。
ただし、完全なPOSIXセマンティクスはサポートしておらず、書き込みには制限があります。
新規ファイルの作成やシーケンシャルな書き込みは可能ですが、既存ファイルの部分書き換えやランダムライトはできません。
既存ファイルの上書きやファイル削除も、起動時にオプションフラグを指定した場合のみ可能です。

■ イメージ図 ※上図は VPCエンドポイント(Gateway型)経由でのアクセスを想定しておりますが、インターネット経由の選択肢もあります。

■ ユースケース

  • 大規模データセットの読み取り中心ワークロード
  • データレイク上の大規模データを既存ツール(pandas、Spark等)で直接読み込みたい場合

■ 参考情報

aws.amazon.com blog.serverworks.co.jp

AWS Storage Gateway(Amazon S3 File Gateway)

オンプレミス環境からS3にファイルプロトコル(NFS/SMB)でアクセスするためのハイブリッドストレージサービスです。
今回紹介する5つの中で唯一、オンプレミスからのファイルアクセスを主目的としたサービスです。

ゲートウェイアプライアンス(VMまたはハードウェア)をデプロイし、ローカルキャッシュを持ちます。
頻繁にアクセスするデータはゲートウェイ上にキャッシュされるため、低レイテンシでアクセスできます。

■ イメージ図 ※S3 File Gatewayは、オンプレミスでもEC2でも構築可能です。

■ ユースケース

  • オンプレミスのファイルサーバーからS3へのデータ移行・統合
  • オンプレミスアプリケーションからS3データへのファイルアクセス
  • バックアップやアーカイブのS3保存

■ 参考情報

docs.aws.amazon.com blog.serverworks.co.jp

Amazon FSx for Lustre

高性能コンピューティング(HPC)向けのフルマネージドファイルシステムです。
Lustreファイルシステムを使い、数百GB/sのスループットとサブミリ秒のレイテンシを実現します。

S3との連携はData Repository Association(DRA)という仕組みで行います。
S3バケットをデータリポジトリとしてリンクすると、S3上のオブジェクトをLustreファイルシステム上のファイルとしてアクセスできます。
処理結果をS3に書き戻すことも可能です。

他のサービスとの違いは、S3上のデータをFSx上にコピーして処理する点です。
S3 FilesやMountpoint for S3がS3上のデータを直接参照するのに対し、FSx for LustreはS3からデータを取り込んで高速なファイルシステム上で処理します。

対応OSはLinuxのみです。

■ イメージ図

■ ユースケース

  • HPC(CAE/CFDシミュレーション等)
  • 機械学習のトレーニング
  • 大規模バッチ処理(動画レンダリング、ゲノム解析等)

■ 参考情報

docs.aws.amazon.com

Amazon FSx for NetApp ONTAP

NetApp ONTAPをベースにしたフルマネージドファイルシステムです。
NFS、SMB、iSCSIのマルチプロトコルに対応しており、エンタープライズ向けの機能が充実しています。

S3との連携は自動データ階層化(Tiering)で行います。
アクセス頻度の低いデータを自動的にS3ベースの容量プールストレージに移動し、コストを最適化します。
アクセス時には自動的にSSDティアに戻されるため、利用者は意識する必要がありません。

データ圧縮、重複排除、コンパクションといったストレージ効率化機能も備えています。

■ イメージ図

■ ユースケース

  • オンプレミスのNetApp/NASからの移行
  • LinuxとWindowsが混在する環境でのファイル共有
  • エンタープライズアプリケーション(Oracle、SAP、SQL Server等)

■ 参考情報

docs.aws.amazon.com blog.serverworks.co.jp

サービス選択フロー

どのサービスを選べばよいか迷ったときは、以下のフローを参考にしてみてください。

%%{init: {"flowchart": {"wrappingWidth": 400}} }%%
flowchart TD
    A[S3データにファイルシステムでアクセスしたい] --> B{エンタープライズNAS機能が必要?<br>(重複排除、Snapshot、iSCSI等)}
    B -->|はい| C[FSx for ONTAP]
    B -->|いいえ| D{HPCや大規模バッチ等<br>超高スループットが必要?}
    D -->|はい| E[FSx for Lustre]
    D -->|いいえ| F{オンプレミスからの<br>アクセスが主目的?}
    F -->|はい| G[S3 File Gateway]
    F -->|いいえ| H{読み取り中心で<br>シンプルに使いたい?}
    H -->|はい| I[Mountpoint for S3]
    H -->|いいえ| J[S3 Files]

    style A fill:#e8f5e9,stroke:#388e3c,color:#1b5e20
    style B fill:#fff3e0,stroke:#f57c00,color:#e65100
    style D fill:#fff3e0,stroke:#f57c00,color:#e65100
    style F fill:#fff3e0,stroke:#f57c00,color:#e65100
    style H fill:#fff3e0,stroke:#f57c00,color:#e65100
    style C fill:#e3f2fd,stroke:#1976d2,color:#0d47a1
    style E fill:#e3f2fd,stroke:#1976d2,color:#0d47a1
    style G fill:#e3f2fd,stroke:#1976d2,color:#0d47a1
    style I fill:#e3f2fd,stroke:#1976d2,color:#0d47a1
    style J fill:#e3f2fd,stroke:#1976d2,color:#0d47a1

※フロー図はあくまで簡易的な判断基準です。実際の選定では要件を詳細に検討してください。

番外編: FSx + S3 Access Points(逆方向の統合)

ここまで「S3のデータをファイルシステムとしてアクセスする」サービスを紹介してきましたが、実は逆方向の統合もあります。

Amazon S3 Access Points for Amazon FSxは、FSx上のファイルデータをS3 API経由でアクセスできるようにする機能です。
データの実体はFSx上に残ったまま、S3のGetObject、PutObject、ListObjectsV2といったオペレーションでアクセスできます。

この機能は以下の2つのFSxサービスで利用可能です。

  • Amazon FSx for OpenZFS
  • Amazon FSx for NetApp ONTAP ※本編で紹介した自動階層化とは別の機能です

「S3をファイルサーバー的に使う」のではなく「ファイルサーバーのデータをS3互換で使う」という逆のアプローチです。
例えば、FSx上のデータをAmazon BedrockやAmazon SageMaker、Amazon Athenaなど、S3をデータソースとするサービスで活用したい場合に便利です。

今回のブログのテーマとはアクセス方向が逆ですが、紛らわしいので整理しておきました。

aws.amazon.com aws.amazon.com blog.serverworks.co.jp

まとめ

S3のデータをファイルシステムとして扱えるサービスを5つ比較しました。

ざっくりまとめると、こんな使い分けになります。

  • S3 Files: S3データにファイルシステムでアクセスしたい汎用的なケース
  • Mountpoint for S3: 読み取り中心でシンプルに使いたいケース
  • S3 File Gateway: オンプレミスからS3にファイルアクセスしたいケース
  • FSx for Lustre: HPCや大規模バッチで超高スループットが必要なケース
  • FSx for ONTAP: エンタープライズNAS移行やマルチプロトコルが必要なケース

S3 Filesの登場で、AWS上のコンピュートからS3データにファイルアクセスする選択肢がぐっと手軽になりました。
コスト面では、Mountpoint for S3はツール自体無料でS3料金のみ、S3 FilesやS3 File Gatewayも比較的低コストで始められます。
一方、FSx for LustreやFSx for ONTAPは専用ファイルシステムのプロビジョニングが必要なため、コストは高めになります。
用途とコストのバランスを考えて、最適なサービスを選んでみてください。

かつべ (記事一覧)

クロスインダストリー第2部

AWS認定資格:SAP,SCS,AIF