Amazon SageMaker Unified Studioがプレビューでリリースされました。公式ドキュメントを参照しながらサービス内容や特徴を紹介します。
特に、この記事では、以下の内容に絞って紹介します。
- What is Amazon SageMaker Unified Studio?
- Terminology and concepts
- Setting up
- Supported Regions
プレビューの時点で東京リージョンでも利用可能なため、日本での利用も早い段階で広がる可能性があると感じています。
Amazon SageMaker Unified Studioとは?
Amazon SageMaker Unified Studioは、分析とAIのためのデータとツールを統合した体験を提供します。Amazon SageMaker Unified Studioを使用すると、AWSの分析および機械学習サービスを利用して、データの探索、モデル開発、生成AI、大規模データ処理、SQL分析を行うことができます。また、Amazon Q Developerのサポートにより、これらのタスクを効率化できます。さらに、統合ノートブックを使って計算リソース間で作業を行ったり、組み込みのSQLエディタで多様なデータソースを探索・クエリしたり、大規模にAIモデルをトレーニング・デプロイしたり、カスタム生成AIアプリケーションを迅速に構築することが可能です。
Amazon SageMaker Unified Studioは、Amazon DataZoneの機能(ドメインを使用した資産とユーザーの整理、プロジェクトを通じた共同作業、アーティファクトのセキュアな共有、計算サービス間のシームレスな作業)を基盤としています。
Amazon SageMaker Unified Studioの主な機能
- 単一の開発環境でデータとツールを活用
- Amazon Bedrockを使用して生成AIアプリケーションを構築・スケール
- Amazon Redshiftの最も費用対効果の高いSQLエンジンでインサイトを得る
- Amazon SageMaker LakehouseでAmazon S3データレイク、Amazon Redshift、フェデレーションデータソースを統合
- Amazon SageMaker AIの完全に管理されたインフラ、ツール、ワークフローを利用して機械学習や基盤モデルを構築・トレーニング・デプロイ
- Amazon EMR、Amazon Athena、AWS Glueを使用してペタバイト規模のデータを分析とAIのために準備・統合・編成
- Amazon DataZoneを基盤とした統合カタログを使用してデータとAIを安全に探索、管理、コラボレーション
Amazon SageMaker Unified Studioへのアクセス方法
1. Amazon SageMaker管理コンソール
Amazon SageMaker管理コンソールから、以下の設定を行うことでアクセスできます。
- ユーザ管理のためのドメイン設定
- Amazon SageMakerプラットフォームドメインへのアカウント関連付け(さまざまな目的でリソースを作成・アクセス可能にする)
- プロジェクトプロファイル
- ブループリント
- Amazon Bedrockモデル
- Git接続
- Amazon Qの使用設定
2. Amazon SageMaker Unified Studio
Amazon SageMaker Unified Studioは、ブラウザベースのウェブアプリケーションです。IAM資格情報、AWS IAM Identity Center経由のIDプロバイダー資格情報、またはSAML資格情報を使用して認証を行い、分析やAIのためのすべてのデータとツールを利用できます。ドメインのAmazon SageMaker Unified Studio URLは、Amazon SageMaker管理コンソールで取得できます。
3. Amazon DataZone HTTPS API
Amazon DataZone HTTPS APIを使用して、Amazon SageMaker Unified Studioにプログラム的にアクセスすることも可能です。このAPIを使用すると、サービスに対してHTTPSリクエストを直接発行できます。詳細は、Amazon DataZone APIリファレンスを参照してください。
Amazon SageMaker Unified Studioの用語と概念
Amazon SageMaker Unified Studioを使用する際、以下の主要な概念、用語、およびコンポーネントを理解することが重要です。
Amazon SageMaker Unified Studio
ブラウザベースのウェブアプリケーションで、分析とAIのためのすべてのデータとツールを使用できます。IAM資格情報、AWS IAM Identity Center、またはSAML資格情報を使用して認証が可能です。管理コンソールでドメインのURLを取得できます。
Amazon SageMaker管理コンソール
管理コンソールを使用して、ユーザー管理、アカウント関連付け、プロジェクトプロファイル、ブループリント、Amazon Bedrockモデル、Git接続、Amazon Qの使用設定を行います。
Amazon Bedrock IDE
Amazon SageMaker Unified StudioにおけるAmazon Bedrock IDEは、生成AIアプリケーションを簡単に構築・スケールするためのツールです。
- ユーザーが生成AIプレイグラウンドでモデルと対話可能
- プロジェクト内で生成AIアプリケーションの開発を共同作業できます。
Amazon Q
AIコーディングアシスタントで、以下をサポートします:
- コードに関するチャット
- インラインコード補完
- 新規コード生成
- セキュリティ脆弱性のスキャン
- コードのアップグレードや改善
Amazon SageMaker Lakehouse
Amazon S3データレイクとAmazon Redshiftデータウェアハウスを統合し、単一のデータコピー上で分析や機械学習(ML)、生成AIアプリケーションを構築します。
Amazon SageMaker Data Processing Visual ETL
Apache Sparkの専門知識がなくても、視覚的なインターフェースで大規模ETL(抽出、変換、ロード)データ統合フローを作成できます。
資産 (Asset)
テーブル、ダッシュボード、ファイルなどの物理データオブジェクトや、ビューなどの仮想データオブジェクトを指します。
資産タイプ (Asset Type)
資産がカタログ内でどのように表現されるかを定義します。資産タイプに基づき、資産がスキーマで検証されます。
関連付けアカウント (Associated Accounts)
異なるAWSアカウントからデータを公開し、プロジェクトを作成して複数のAWSアカウントで作業できます。
認可ポリシー (Authorization Policy)
プロジェクトやブループリントなどのエンティティに適用される制御設定です。
AWSアカウントオーナー
Amazon SageMaker Unified StudioでAWSアカウントを管理する責任者で、ロールやポリシー、アクセス許可を設定します。
ブループリント (Blueprint)
プロジェクトプロファイルを作成するためのテンプレートで、プロジェクトで使用できるAWSツールやサービスを定義します。
サポートされるブループリント例:
- AmazonBedrockGenerativeAI: 生成AIアプリケーションの構築ツールを提供。
- DataLake: データ管理のためのAWS GlueデータベースとAmazon Athena作業グループを作成。
- RedshiftServerless: Amazon Redshift Serverless環境を作成。
ビジネスデータカタログ (Business Data Catalog)
公開された資産をプロジェクト間で検索・購読できるカタログです。
プロジェクト (Project)
作業を整理し、コード(ノートブック、クエリ、ダッシュボードなど)を格納するためのエンティティです。
Querybook
SQLクエリを実行・共有するためのインタラクティブノートブックで、Amazon RedshiftやAmazon Athenaを使用します。
スペース (Space)
ユーザーが独立して作業できるサンドボックス環境を提供します。
メタデータフォーム (Metadata Form)
資産作成時に収集・保存されるメタデータを定義します。
プロジェクトプロファイル (Project Profile)
プロジェクト作成時に使用するテンプレートです。
サブスクリプションリクエスト (Subscription Request)
特定の資産へのアクセスをリクエストするプロセスです。
その他の用語
- プロジェクトGitリポジトリ: プロジェクト内でコードのバージョン管理を行うためのリポジトリ。
- データソース (Data Source): データの技術メタデータを取り込むためのエンティティ。
- ドメイン (Domain): 資産、ユーザー、プロジェクトを組織化する単位。
Amazon SageMaker Unified Studioのセットアップ
Amazon SageMaker Unified Studioを使用する前に、AWSアカウントの作成と管理者ユーザーの設定を行う必要があります。
トピック
AWSアカウントのサインアップ
AWSアカウントを持っていない場合は、以下の手順で作成してください。
AWSアカウントの作成方法
- AWSサインアップページを開きます。
- 画面の指示に従って手続きを進めます。
サインアップ手続きの一環として、電話での認証コード入力が必要です。 - サインアップが完了すると、AWSアカウントのルートユーザーが作成されます。
ルートユーザーは、すべてのAWSサービスとリソースにアクセスできるため、セキュリティの観点から、管理者アクセス権を別のユーザーに割り当て、日常的な作業にはルートユーザーを使用しないことをお勧めします。 - サインアップ完了後、AWSから確認メールが送信されます。アカウントのアクティビティや管理は、AWS公式サイトの「My Account」からいつでも確認できます。
管理者アクセス権を持つユーザーの作成
AWSアカウントのサインアップ後は、以下の手順でルートユーザーを保護し、管理者ユーザーを作成します。
ルートユーザーの保護
-
AWS管理コンソールにサインイン
ルートユーザーとしてサインインし、AWSアカウントのメールアドレスを入力して次のページでパスワードを入力します。- 詳細はAWSサインインユーザーガイドを参照してください。
-
多要素認証(MFA)の有効化
- ルートユーザーに対して仮想MFAデバイスを有効にします。
- 手順は、IAMユーザーガイドの該当セクションを参照してください。
IAM Identity Centerの有効化と管理者ユーザーの作成
-
IAM Identity Centerを有効化
- 手順はAWS IAM Identity Centerユーザーガイドを参照してください。
-
管理者アクセス権をユーザーに付与
- IAM Identity Centerディレクトリを使用して管理者アクセス権を付与します。
- 詳細な手順はデフォルトIAM Identity Centerディレクトリの設定方法を参照してください。
管理者アクセス権を持つユーザーとしてサインイン
-
サインイン方法
IAM Identity Centerユーザーの作成時に送信されたサインインURLを使用してログインします。- 詳細はAWSサインインユーザーガイドを参照してください。
他のユーザーへのアクセス権付与
-
最小権限ベースのアクセス権を作成
- IAM Identity Centerで「権限セット」を作成します。詳細は権限セットの作成手順を参照してください。
-
ユーザーグループの作成とアクセス権の割り当て
- ユーザーをグループに割り当て、シングルサインオン(SSO)アクセスを付与します。
- 手順はAWS IAM Identity Centerユーザーガイドの該当セクションを参照してください。
Amazon SageMaker Unified Studioがサポートされているリージョン
現在、Amazon SageMaker Unified Studioは以下のAWSリージョンで利用可能です。
-
アジアパシフィック(東京):
ap-northeast-1
-
ヨーロッパ(アイルランド):
eu-west-1
-
米国東部(バージニア北部):
us-east-1
-
米国東部(オハイオ):
us-east-2
-
米国西部(オレゴン):
us-west-2
これらのリージョンでAmazon SageMaker Unified Studioのサービスをご利用いただけます。