アプリケーションサービス部、濱岡です!
AWS Summit2024で参加したセッションのレポートです! 私はデータ分析を中心に案件に関わっているのでそれに関係するものをみてみました!
Dive deep on Amazon S3
概要
Amazon S3 は、業界トップクラスのスケーラビリティ、耐久性、セキュリティ、パフォーマンスを提供するクラウドオブジェクトストレージです。このセッションでは、Amazon S3 の基盤となるアーキテクチャを掘り下げ、どのようにしてスケーリングと伸縮自在性を実現しているのかを見ていきます。データ保護方法、データの耐久性に対する考え方や文化、そして新しい Amazon S3 Express One Zone ストレージクラスがどのように一貫したパフォーマンスを実現するかについて知っていただき、利用者の機械学習ワークロードや、データ分析を支える仕組みの理解を深めます。
7/5までオンデマンドで配信中です。 ※登録(無料)とログインが必要です。
弊社、山本が記事を書いておりますので、ぜひみてみてください。
感想
AWSで一番身近といっても過言ではないAmazon S3。 データの保管でよく利用するので、セッションを聞きに行ってみました。
以下のような内容でした。
- Amazon S3とは
- フロントエンドの理解
- インデックスの理解
- ストレージ層の理解
- Amazon S3 Express One Zone ストレージクラス
- 誤削除への対策
私が特に気になったのは、Amazon S3 Express One Zone ストレージクラスについてです。 最近でたストレージクラスですね。
いつも汎用的に利用しているAmazon S3バケットはマルチAZがデフォルトとなっていますが、こちらはシングルAZとなっています。 シングルAZのため、障害があった際にデータが失われる可能性がありますが、レイテンシーを低減でき、高パフォーマンスを維持することができます。
そのため、I/Oが重視される機械学習の基盤での利用を想定されています。 ストレージのレイテンシーを減らすことでコンピュートリソースの削減をすることができます。
生成 AI を推進するデータ基盤の構築
概要
データは長年にわたり、多くの組織にとって戦略的資産とみなされてきましたが、生成 AI はデータ戦略の重要性を改めて強調しています。独自のモデルを構築するか、ファウンデーションモデルをカスタマイズするかにかかわらず、データは生成 AI の主要な差別化要因となります。そのため、関連性の高い高品質のデータをサポートするデータ戦略が必要です。このセッションでは、生成 AI 戦略の原動力となるデータサービスと、生成 AI アプリケーションを一般的なツールから、あなたのビジネスとお客様を本当に理解するプログラムに変える際に必要となる、一般的なデータパターンについて学ぶ事ができます。
7/5までオンデマンドで配信中です。 ※登録(無料)とログインが必要です。
感想
AWS Summitの中でも生成系AIの話が多く、私も興味があったので聞きに行ってみました。
生成系AIと聞くと基盤モデルですね。 その基盤モデルの利用方法については解説していました。
また、印象に残っていることは生成系AIにおいてはデータが大事であるということです。 生成系AIといえば基盤モデルにフォーカスしている人が多いです。 しかし、生成系AIは基盤モデルだけで何かができるわけではなく、自分たちのビジネスへ繋げて成果を出すのが本質的なところになります。
基盤モデルは自社だけがそれを支えるわけではなくだれでも扱うことができます。 そうなると差別化できるのはデータです。 データによって差別化し、自分たちのビジネスへ繋げていくことだ大事だということを学びました。
データ基盤のコストを最適化するベストプラクティス
概要
幅広い用途でのデータ活用が広がる中、データ活用とその基盤のコストの最適化は多くの企業において重要な関心ごととなっています。このセッションでは、AWS で費用対効果の高いデータ基盤を構築・運用するベストプラクティスを解説します。ワークロードに適したサービスやオプションを選択し、コストを犠牲にすることなくスケーラブルでパフォーマンスの高いアーキテクチャを設計します。AWS Glue や Amazon EMR、Amazon Athena、Amazon S3 などのサービスを適切に組み合わせ、多様なコスト削減オプションを実装することで、費用対効果の高いデータ基盤を実現しコストを最適化します。
7/5までオンデマンドで配信中です。 ※登録(無料)とログインが必要です。
感想
データ基盤を構築して運用していくと、どうしてもコストがかかるイメージがあり、このセッションを聞きに行きました。
このセッションではいくつか項目をだしてコストの最適化について紹介してしたが、私が一番印象に残っているのはデータ転送コストの最適化についてです。
データ転送量はインターネットへ通信する際に料金がかかります。 そのため、ゲートウェイエンドポイントを利用することで、コストの削減を行うことができます。 また、AZをまたぐことで料金が発生するので、そこも考慮するとコストの削減につながります。
そこまで通信経路について考えたことがなかったのですが、こういうこともコストの削減につながっていくんだなと思いました。
まとめ
いかがでしたでしょうか? 気になったセッションありましたら、7/5までは視聴可能ですのでぜひみてみてくださいね!
以上、濱岡でした!