2025-08-12から1日間の記事一覧

Amazon Athenaを高速化!バケッティングとパーティションの違い

はじめに 今日は、Amazon Athena クエリのパフォーマンスを向上させる方法についてご紹介します! Athena とは、Amazon S3 に保存されているデータを中心に、SQL を使ってさまざまなデータソースにクエリを実行できるサービスです。 クエリのパフォーマンス…

【Databricks入門】Unity Catalogの階層構造を解説!チュートリアル前の基礎知識

この記事では、Databricksで利用されるUnity Catalogにおけるデータの階層構造と、その各コンポーネントの役割を解説します。本記事の最終的な目標は、公式チュートリアルに取り組む際に、Unity Catalog独自の用語でつまずかないように基礎知識を身につけら…

データレイクハウスとは

従来、データ基盤は「データレイク」と「データウェアハウス」を組み合わせるのが一般的でした。 しかしこの構成は、システムの複雑さや運用コストの増大といった課題を抱えていました。 データレイクハウス(以下、レイクハウス)は、これらの課題を解決す…

なんとなく知っていたつもりのデータレイクを再学習。Databricksで活かすレイクハウスとは?

はじめに データレイクとは データレイクのメリットについて とりあえず放り込める 一元管理し易い 分析や機械学習に利用するためのデータを揃えやすい データレイクのデメリットについて 何が入っているかわからなくなる(データの沼化) データの品質と整…

Amazon Bedrock Client for Mac の紹介とgpt-ossを利用する際の設定

Amazon Bedrock Client for Mac とは AWSがGitHubで公開・提供している "Amazon Bedrock Client for Mac" というMac用のクライアントアプリケーションです。 https://github.com/aws-samples/amazon-bedrock-client-for-mac Mac専用とはなりますが、Amazon B…

開発環境のインスタンスが直近どのくらいの時間起動していて、料金がいくらかかっているかを Slack に簡単に通知する Step Functions

こんにちは カスタマーサクセス部の山本です。 概要 Slack 側の設定 (アプリの作成) メモしておくものまとめ EventBridge の 「接続」作成 メモしておくものまとめ インスタンスタイプごとの料金をメモ Step Functions Step Functions の全体構成 1. Describ…

AWS Price List Query API を使用して EC2 のオンデマンドインスタンスの料金を取得する

こんにちは カスタマーサクセス部の山本です。 AWS Price List Query API を使用して EC2 のオンデマンドインスタンスの料金を取得する AWS CLI 事前準備:filters.json を用意 filters.json の説明 1. リージョンコード 2. オペレーティングシステム 3. テ…