39
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

アイレット株式会社Advent Calendar 2024

Day 11

【AWS re:Invent】Amazon SageMakerが大幅アップデート!データレイクハウス基盤でAI開発を加速

Last updated at Posted at 2024-12-08

誤りなどがありましたら随時修正していく予定です。

この記事で伝えたいこと(ポイント)

次世代の Amazon SageMaker は、データ、分析、AI を統合したプラットフォームです。データレイクハウスを基盤とし、SageMaker Lakehouse、SageMaker Data and AI Governance などの新機能により、データサイエンティストやアナリストは単一の環境でデータ分析から AI アプリケーション構築まで、より効率的に作業を進められます。

次世代の Amazon SageMaker は、以下の主要な機能を備えています。

  • SageMaker Lakehouse: データレイクとデータウェアハウスの境界を取り払い、単一のデータを複製や移動することなくデータ分析と AI/ML アプリケーションの構築を可能にするサービスです。
  • SageMaker Data and AI Governance: Amazon DataZone を基盤として構築された Amazon SageMaker Catalog を含み、ユーザーがデータと AI ワークフローを安全に発見、管理、共同作業できるようにします。
  • 統合されたスタジオ環境: データエンジニアリング、アナリティクス、生成 AI を統合したスタジオ環境を提供し、データサイエンティストやアナリストは、データの所在を気にすることなく、単一の環境で作業を行うことができます。

はじめに

Amazon SageMaker は、機械学習モデルの構築、トレーニング、デプロイを容易にするためのフルマネージドサービスとして広く利用されてきました。今回、AWS は Amazon SageMaker をさらに進化させ、データ、分析、AI を統合したプラットフォームとして生まれ変わらせました。この記事では、次世代の Amazon SageMaker の概要、新機能、ユースケース、そしてそれがもたらすメリットについて解説します。

サービスの説明

次世代の Amazon SageMaker は、データレイクハウスを中心としたアーキテクチャを採用し、データエンジニアリング、アナリティクス、生成 AI を合理化されたスタジオに統合したプラットフォームです。これにより、データサイエンティストやアナリストは、データの所在を気にすることなく、単一の統合環境でデータへのアクセス、分析、AI モデルの構築、トレーニング、デプロイを行うことができます。

SageMaker Lakehouse

SageMaker Lakehouse は、データレイクとデータウェアハウスの境界を取り払い、単一のデータを複製や移動することなくデータ分析と AI/ML アプリケーションの構築を可能にするサービスです。Apache Iceberg と互換性のあるツールやエンジンを使用してデータにアクセスし、クエリを実行することができます。

SageMaker Data and AI Governance

SageMaker Data and AI Governance は、Amazon DataZone を基盤として構築された Amazon SageMaker Catalog を含み、ユーザーがデータと AI ワークフローを安全に発見、管理、共同作業できるようにします。

どんな時に利用できるか

次世代の Amazon SageMaker は、以下のようなユースケースで特に効果を発揮します。

機械学習モデルの開発

データの準備からモデルのトレーニング、デプロイまで、機械学習モデル開発の全プロセスを統合環境で効率的に行うことができます。

データ分析

データレイクハウスに統合されたデータに、様々なツールやエンジンを使ってアクセスし、分析することができます。

生成 AI の活用

生成 AI を活用したアプリケーション開発を、データ分析や機械学習のワークフローと統合して行うことができます。

どんなサービスと連携できるか

次世代の Amazon SageMaker は、既存の AWS サービスと連携して、より強力なデータ分析・AI プラットフォームを構築することができます。

Amazon S3

Amazon S3 は、データレイクの基盤となるオブジェクトストレージサービスです。SageMaker Lakehouse は、S3 に格納されたデータに直接アクセスし、分析することができます。

Amazon Redshift

Amazon Redshift は、データウェアハウスサービスです。SageMaker Lakehouse は、Redshift に格納されたデータにもアクセスし、分析することができます。

AWS Glue

AWS Glue は、データ統合サービスです。SageMaker Lakehouse は、Glue を使用して、様々なデータソースからデータを収集し、データレイクに統合することができます。

Amazon Athena

Amazon Athena は、サーバーレスのクエリサービスです。SageMaker Lakehouse は、Athena を使用して、データレイクに格納されたデータに対してクエリを実行することができます。

まとめ

次世代の Amazon SageMaker は、データ、分析、AI を統合したプラットフォームとして、データサイエンティストやアナリストの生産性を向上させ、より迅速なイノベーションを促進します。データレイクハウスを中心としたアーキテクチャ、統合されたスタジオ環境、そして生成 AI の活用により、企業はデータからより多くの価値を引き出すことができるようになります。

おわり

39
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
39
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?