Apache Iceberg

Amazon S3上のデータを分析するアーキテクチャ例~HiveとApache Iceberg比較~

サーバーワークスの村上です。 今回はAmazon S3上にあるデータを外部テーブルとして分析する際、どのような方法があるか、主にHiveとApache Icebergを中心に比べてみました。 想定シーン パターン一覧 結論:Hive形式 とApache Iceberg形式の比較 扱うJSONデ…

【後編】AWS Glue ETLジョブから Amazon S3 Tables 上の Apache Iceberg テーブルにアクセスしてみる

(前編はこちら) こんにちは。荒井です。 前回の記事では、Amazon S3 Tables 上に Apache Iceberg テーブルを作成し、Athena からクエリできるところ並びに Glue データカタログには登録されていないところまで確認しました。 この記事では、AWS Glue ETLジョ…

【前編】Amazon S3 Tables + Apache Iceberg + Athenaを触ってみた

寒暖差で久しぶりにガッツリ体調を崩した荒井です。薬を飲んでも体調戻るのが明らかに遅くなっててダブルの意味で辛くなっています。 今回はタイトルにもある通り、Amazon S3 Tables + Apache Iceberg (+ Athena)について調査する機会がありましたので記事に…

【AWS re:Invent 2024】Amazon EMR Serverlessを使用してApache Icebergについて学ぶワークショップに参加してきました!

AWS re:Invent 2024から帰国して真っ先に食べたのは白米と納豆と漬物の小菅です。 2024年12月02日~06日でラスベガスで開催されたAWS re:invent 2024に参加してまいりました。 Keynote、数多くのブレイクアウトセッションがある中で 以下ワークショップに参…

AuroraからS3へのDMSを利用した継続的レプリケーション

はじめに 前提 AuroraMySQL情報 検証で使用するテーブル DMSセットアップ手順 ソースエンドポイント作成 ソースエンドポイント作成 ターゲットエンドポイント作成 レプリケーションデータ保存先S3バケット作成 IAMロール作成 IAMロールに権限をアタッチ ター…