Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

This article is a Private article. Only a writer and users who know the URL can access it.
Please change open range to public in publish setting if you want to share this article with other users.

AWS Certified AI Practitioner(AIF)対策:AWS Glue DataBrew・SageMaker Data Wrangler

Last updated at Posted at 2024-12-10

AWS Glue DataBrew

『データのクリーニングと前処理に特化したツール』

データのクリーニング作業

  • 欠損値の処理
  • データ型の変更
  • フィルタリング

レシピ機能

『頻繁に使用する前処理ステップをレシピとして保存し、他のプロジェクトやデータセットに再利用できる』

  • データサイエンティストがデータの前処理を視覚的に行う際に非常に便利です。
  • 複雑なコードを書くことなく、GUIを通じてデータのクレンジングや変換操作を簡単に設定できます。
  • データ準備の時間を大幅に削減し、データサイエンティストの生産性が向上されます。

SageMaker Data Wrangler

『機械学習モデルに適した特徴量エンジニアリングを行うツール』

  • データの変換
  • 特徴量の生成
  • 視覚化

に優れています。

特徴

  • データの前処理や特徴エンジニアリングを自動化できます。
  • モデルを作成する前に、データをクリーンアップしたり、変換したり、分析したりする必要がありますが、Data Wranglerはそのプロセスを効率化します。
  • コードをほとんど書かずに、GUI上でデータの操作ができます。
  • データ準備にかかる時間を大幅に短縮し、モデル開発に集中できるようにするツールです。
  • 複数のデータソース(S3、Redshiftなど)から簡単にデータをインポートできます。

ユースケース

ある企業は、機械学習モデルの開発に向けてデータの前処理を行っています。データのクリーニングと特徴量エンジニアリングを効率よく行うために、AWS Glue DataBrewとSageMaker Data Wranglerの両方を使用します。

この場合、次の使い方となります。

『Glue DataBrew でデータをクリーニングして、SageMaker Data Wrangler で特徴量エンジニアリングをする』

0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?