はじめに
この記事では、AWSの3つの主要サービス「AWS Glue」「Amazon SageMaker」「Amazon Athena」について、それぞれの役割や使い方の違いを簡単に整理していきます。
技術検証とかではなくて、自分の知識を整理する内容となっていますが、何卒よろしくお願いいたします。
書こうと思ったきっかけ
現在、AWSの認定試験の勉強を進める中で、これらのサービスについて問われる機会がかなり多く、大変です...(笑)。
ちなみに以下のAWS認定を受ける予定となっています!頑張ります!!🔥
AWS Certified Data Engineer - Associate
マネコン上であまり使ったことがなかったため、どのようなことができるのか、またそれぞれのサービスにどのような違いがあるのかを整理して理解を深めたいと思い、記事としてアウトプットすることにしました。
調べた内容
AWS Glue
一言で言うと:「データの準備屋さん」
- 複数のデータソース(S3、RDSなど)からデータを収集、整形して他のサービスに渡すETLツール
- データカタログ機能でS3上のデータもデータベースのように扱える
AWS Glue は、分析を行うユーザーが複数のソースからのデータを簡単に検出、準備、移動、統合できるようにするサーバーレスのデータ統合サービスです。分析、機械学習、アプリケーション開発に使用できます。また、ジョブの作成、実行、ビジネスワークフローの実装のための生産性向上に役立つツールやデータ運用ツールも追加されています。
引用元:https://docs.aws.amazon.com/ja_jp/glue/latest/dg/what-is-glue.html
このサービスです!
参考文献
Amazon SageMaker
一言で言うと:「機械学習の全部入りツールキット」
- AI/機械学習モデルの作成、学習、デプロイを一貫して行える
- Jupyter Notebookベースの開発環境を提供
- 作成したモデルをAPIとして公開して利用可能
Amazon SageMaker は、包括的な AI および分析サービスを統合エクスペリエンスにまとめ、データ処理、SQL 分析、モデルの開発とトレーニング、および生成 AI を可能にします。
引用元:https://aws.amazon.com/jp/sagemaker/
このサービスです!
参考文献
Amazon Athena
一言で言うと:「S3上のデータにSQLで質問できるサービス」
- S3に保存されたCSVやJSON、Parquetなどのデータに対して直接SQLクエリが実行できる
- サーバーレスでインフラ構築不要
- クエリ実行ごとにスキャンしたデータ量で課金される
Amazon Athena は、標準的な SQL を使用して Amazon Simple Storage Service (Amazon S3) 内のデータを直接分析することを容易にするインタラクティブなクエリサービスです。
引用元:https://docs.aws.amazon.com/ja_jp/athena/latest/ug/what-is.html
このサービスです!
サービスの仕組みはこんな感じみたいです!
参考文献
まとめ
ここまでお読みいただき、ありがとうございました!
サービス名 | 役割 | 使う場面 |
---|---|---|
AWS Glue | データの整理と加工(ETL) | 分散したデータを分析用に整える |
Amazon SageMaker | AIモデルの作成と運用 | 売上予測、分類モデルなどの開発・実運用 |
Amazon Athena | S3上のデータにSQLで分析 | ログやCSVなどを簡単に調査・分析したい時 |
これらのサービスは、それぞれ目的が異なるため、どのような処理や分析を行いたいかによって使い分ける必要があると感じました!
試験対策だけでなく、今後の実務にも役立つよう、しっかり理解しておきたいと思います...!