誤りなどがありましたら随時修正していく予定です。
この記事で伝えたいこと(ポイント)
次世代の Amazon SageMaker は、データ、分析、AI を統合したプラットフォームです。データレイクハウスを基盤とし、SageMaker Lakehouse、SageMaker Data and AI Governance などの新機能により、データサイエンティストやアナリストは単一の環境でデータ分析から AI アプリケーション構築まで、より効率的に作業を進められます。
次世代の Amazon SageMaker は、以下の主要な機能を備えています。
- SageMaker Lakehouse: データレイクとデータウェアハウスの境界を取り払い、単一のデータを複製や移動することなくデータ分析と AI/ML アプリケーションの構築を可能にするサービスです。
- SageMaker Data and AI Governance: Amazon DataZone を基盤として構築された Amazon SageMaker Catalog を含み、ユーザーがデータと AI ワークフローを安全に発見、管理、共同作業できるようにします。
- 統合されたスタジオ環境: データエンジニアリング、アナリティクス、生成 AI を統合したスタジオ環境を提供し、データサイエンティストやアナリストは、データの所在を気にすることなく、単一の環境で作業を行うことができます。
はじめに
Amazon SageMaker は、機械学習モデルの構築、トレーニング、デプロイを容易にするためのフルマネージドサービスとして広く利用されてきました。今回、AWS は Amazon SageMaker をさらに進化させ、データ、分析、AI を統合したプラットフォームとして生まれ変わらせました。この記事では、次世代の Amazon SageMaker の概要、新機能、ユースケース、そしてそれがもたらすメリットについて解説します。
サービスの説明
次世代の Amazon SageMaker は、データレイクハウスを中心としたアーキテクチャを採用し、データエンジニアリング、アナリティクス、生成 AI を合理化されたスタジオに統合したプラットフォームです。これにより、データサイエンティストやアナリストは、データの所在を気にすることなく、単一の統合環境でデータへのアクセス、分析、AI モデルの構築、トレーニング、デプロイを行うことができます。
SageMaker Lakehouse
SageMaker Lakehouse は、データレイクとデータウェアハウスの境界を取り払い、単一のデータを複製や移動することなくデータ分析と AI/ML アプリケーションの構築を可能にするサービスです。Apache Iceberg と互換性のあるツールやエンジンを使用してデータにアクセスし、クエリを実行することができます。
SageMaker Data and AI Governance
SageMaker Data and AI Governance は、Amazon DataZone を基盤として構築された Amazon SageMaker Catalog を含み、ユーザーがデータと AI ワークフローを安全に発見、管理、共同作業できるようにします。
どんな時に利用できるか
次世代の Amazon SageMaker は、以下のようなユースケースで特に効果を発揮します。
機械学習モデルの開発
データの準備からモデルのトレーニング、デプロイまで、機械学習モデル開発の全プロセスを統合環境で効率的に行うことができます。
データ分析
データレイクハウスに統合されたデータに、様々なツールやエンジンを使ってアクセスし、分析することができます。
生成 AI の活用
生成 AI を活用したアプリケーション開発を、データ分析や機械学習のワークフローと統合して行うことができます。
どんなサービスと連携できるか
次世代の Amazon SageMaker は、既存の AWS サービスと連携して、より強力なデータ分析・AI プラットフォームを構築することができます。
Amazon S3
Amazon S3 は、データレイクの基盤となるオブジェクトストレージサービスです。SageMaker Lakehouse は、S3 に格納されたデータに直接アクセスし、分析することができます。
Amazon Redshift
Amazon Redshift は、データウェアハウスサービスです。SageMaker Lakehouse は、Redshift に格納されたデータにもアクセスし、分析することができます。
AWS Glue
AWS Glue は、データ統合サービスです。SageMaker Lakehouse は、Glue を使用して、様々なデータソースからデータを収集し、データレイクに統合することができます。
Amazon Athena
Amazon Athena は、サーバーレスのクエリサービスです。SageMaker Lakehouse は、Athena を使用して、データレイクに格納されたデータに対してクエリを実行することができます。
まとめ
次世代の Amazon SageMaker は、データ、分析、AI を統合したプラットフォームとして、データサイエンティストやアナリストの生産性を向上させ、より迅速なイノベーションを促進します。データレイクハウスを中心としたアーキテクチャ、統合されたスタジオ環境、そして生成 AI の活用により、企業はデータからより多くの価値を引き出すことができるようになります。
- 参考:Next generation Amazon SageMaker
- 参考:Introducing the next generation of Amazon SageMaker: The center for all your data, analytics, and AI