皆さん、こんにちは!サーバーワークスのAnhです。
AWS環境上で生成AIモデルの構築に興味があり、Amazon SageMakerのStudioとCanvasの違いが気になったので調査しました。
このブログでは、主にそれらのサービスの概要に触れています。
SageMaker StudioとSageMaker Canvasの違い
Amazon SageMakerは、機械学習プロジェクトを手軽に扱えるように設計されたクラウドベースのサービスです。機械学習モデルの構築からトレーニング、デプロイメントに至るまでのプロセスを提供してくれます。
SageMaker CanvasとSageMaker Studioは、Amazon SageMakerの中で異なるニーズとユーザーベースを対象としていますが、どちらも同じプラットフォームの一部として機能し、AWSの広範な機械学習サービスと連携しています。この二つのツールの違いを以下の表にまとめました。
特徴 | SageMaker Studio | SageMaker Canvas |
---|---|---|
対象ユーザー | データサイエンティスト、開発者 | ビジネスアナリスト、ビジネスユーザー |
使用目的 | 深い機械学習モデルの開発とトレーニング | よりシンプルで直感的なインターフェースを通じたMLモデルの構築 |
プログラミングスキル | 必要 | 不要 |
インターフェース | コードベースの開発環境 | GUIベースのビジュアルインターフェース |
機能 | - 高度なMLモデルの構築とトレーニング - データ準備、モデルビルディング、トレーニング、デプロイまでの一連のプロセスをサポート - Jupyterノートブックのサポート |
- ノーコードでのMLモデルの作成 - ドラッグ&ドロップでのデータ準備とモデルの構築 - ビジュアルベースでのデータ分析と予測 |
SageMaker Studio
特徴
SageMaker Studioは、機械学習のための統合された開発環境を提供してくれるサービスです。データ準備からモデルのビルド、トレーニング、デプロイまで、MLワークフローのすべてを一つのインターフェースで管理できます。
SageMaker Studioの主な特徴は以下通りです。
- 統合型開発環境 (IDE): Jupyterノートブックを中心とした開発環境を提供し、データの準備からモデルのビルディング、トレーニング、デプロイメントまでの一連のプロセスをサポートします。
- 自動化されたML機能: SageMaker Autopilotなどの機能を通じて、自動化されたデータ前処理、モデルトレーニング、ハイパーパラメータチューニングを提供します。
- 広範なMLアルゴリズムとフレームワークのサポート: ビルトインのMLアルゴリズムと、TensorFlow、PyTorch、MXNetなどの人気のあるオープンソースMLフレームワークに対応しています。
- 簡単なデプロイメントと監視:トレーニング済みモデルを数クリックでデプロイし、リアルタイムまたはバッチ推論エンドポイントを簡単に設定できます。モデルのパフォーマンスを監視し、再トレーニングやアップデートが必要な場合にアラートを受け取れます。
SageMaker Studioで利用できる機能について興味がある方は以下のブログも参考にしてください。
料金
SageMaker Sudioでかかるコストは主に以下の料金の合計で計算されます。
- インスタンス使用料:SageMaker Studioを使用するとき、ノートブックインスタンスやモデルトレーニング、モデルデプロイ用のインスタンスを起動するための料金がかかります。これらの料金は選択するインスタンスのタイプと使用時間によって決まります。
- ストレージ料金:トレーニングデータやモデルアーティファクトを保存するためのストレージ使用料が発生します。
- データ転送料金:AWSの外にデータを転送する際には、追加の料金がかかる場合があります。
公式サイトから料金の計算例を参考にすると、SageMaker Sudioの利用料金は割高ではあり、利用する際に注意を払う必要があります。
初心者向けの学習目的であれば、次の項目で紹介するSageMaker Studio Labの利用をおすすめします。
SageMaker Studio Lab
SageMaker Studioとは異なり、SageMaker Studio LabはAWSが無料で提供してくれる機械学習と実験のための無料のクラウドベースのJupyterノートブック環境です。GitHubからの直接のプロジェクトインポートや、人気のあるオープンソースライブラリとツールとの互換性を持っています。
Studio LabはAWSアカウントなしで利用でき、アカウント発行のリクエストを行い、発行してもらう必要があります。Studio Labの使用料金は無料ですので、料金の心配なく機械学習を学べます。
SageMaker Studio Lab公式サイト:https://studiolab.sagemaker.aws/
SageMaker Canvas
特徴
Amazon SageMaker Canvasは、非技術的なユーザーでも機械学習モデルを簡単に作成し、データに基づいて予測を行うことができる、ビジュアルベースのウェブアプリケーションです。直感的なドラッグアンドドロップインターフェースを使用して、データを準備し、分析し、予測モデルを構築することができます。
Amazon SageMaker Canvasの主な特徴について以下にまとめました。
- ユーザーフレンドリーなインターフェース: ノーコードのインターフェースを通じて、データのアップロード、前処理、モデルのトレーニング、そして予測が可能です。
- 自動データクレンジングと前処理: Canvasは自動的にデータのクレンジングと前処理を行い、モデルトレーニングの準備をします。
- ビジュアルデータ分析: データを視覚的に探索し、有益なインサイトを得るためのツールを提供します。
- 自動モデルトレーニング: ユーザーが目的変数を指定すると、Canvasは自動的に複数の機械学習モデルをトレーニングし、最適なものを選択します。
- 直感的な予測生成: トレーニング済みモデルを使用して、新しいデータに対する予測を瞬時に生成できます。
料金
公式サイトの内容を参考に、SageMaker Canvasでかかるコストについて以下通りでまとめました。
- ログイン時間に基づく料金:SageMaker Canvasを使っている時間、つまりワークスペースにログインして作業している時間に基づいて料金がかかります。主にデータの取り込み、準備、分析、モデルを使った実験、予測結果の確認などの作業が対象です。
- すぐに使えるモデルの利用料:AWSのAIサービスから提供される、予め用意されているモデルを使った場合、その利用量に応じて料金が発生します。
- カスタムモデルの作成と予測の料金: 自分でモデルを作成し、それを使って予測を行う場合、作成したモデルの種類に応じて料金がかかります。
SageMaker Canvas公式サイト:https://aws.amazon.com/jp/sagemaker/canvas/pricing/
おわりに
Amazon SageMakerの二つの異なるサービス、SageMaker StudioとSageMaker Canvasの主な違いについて掘り下げてきました。SageMaker Studioは、より技術的なユーザー向けの包括的な機械学習開発環境を提供する一方で、SageMaker Canvasは非技術的なユーザーが直感的なインターフェースを通じて機械学習モデルを簡単に構築できるように設計されています。
私も機械学習の初心者であり、この二つのツールの違いを理解することは、私自身の学習プロセスにおいて非常に有益でした。
そしてこの記事を読んでいただき、ありがとうございました。皆さんがこの記事を通じて、Amazon SageMaker に興味を持っていただけたなら幸いです。