LoginSignup
2
2

【AWS】SageMaker備忘録

Posted at

SageMakerとは

機械学習のワークフローであるラベル付け、開発、学習、モデル変換、推論デプロイを一貫して提供するマネージドサービス。

数分で開発環境を起動でき、必要なときだけ高性能マシンや分散マシン、GPUを使用して学習・推論ができる。

  1. S3へ学習データを置く
  2. 開発環境でモデル開発
  3. SageMakerに合わせた学習・推論コードへ変換する
  4. 変換コードを実⾏し、SageMakerマネージドのEC2/コンテナで学習・評価をする
  5. 推論エンドポイント(SageMakerマネージドEC2)にデプロイする

データ準備から推論モデルのデプロイまでのアーキテクチャー概要
SageMaker_1.PNG

開発環境の開始

  1. SageMaker Domain をセットアップを押して、SageMaker Domainを作成する
    Sagemeker01.PNG
  2. Domain -> ユーザープロファイルを選択する
    Sagemeker02.PNG
  3. 起動からStudioを起動する
  4. +Create Studio Classic spaceを押して、Classic共有環境を立ち上げる
    Sagemeker03.PNG
  5. +Create JupyterLab spaceを押して、JupyterLab共有環境を立ち上げる
    Sagemeker04.PNG

SageMakerの記法へのコード変換

SageMaker_1123.PNG

SageMakerの各サービス

SageMaker_112qwf3.PNG

自動化されたSageMaker

  • SageMaker Autopilot
    データの前処理からモデルの選択、ハイパーパラメータの最適化、学習、デプロイまでを全自動でできるAutoMLサービス
  • SageMaker JumpStart
    オープンソースモデルをデプロイし仕様できるサービス

SageMakerの学習環境

組み込みアルゴリズム

データ準備

  • Data Wrangler
    300を超える組み込みのデータ処理が含まれているため、コードを記述しなくても、特徴量をすばやく正規化、変換、および結合できる。
  • EMR
  • Glue

データ処理

  • SageMaker Processing
  • SageMakerApache Spark

特徴量の保存

  • SageMaker Feature Store

評価

  • SageMaker Clarify
  • SageMaker Model Monitor

推論モデルデプロイ

SageMakerのモデルデプロイは主に4つの方法を提供している。

  • リアルタイム推論
    常時稼働な即時レスポンスが必要なデプロイオプション。
    SageMaker Endpoint, Multi-Model Endpoint, Multi-Container Endpoint
  • サーバーレス推論
    コールドスタートのため、リアルタイムではないが、コストが安い。
  • 非同期推論
    非同期処理のため、リアルタイムではない。
  • バッチ推論
    低頻度・大量データ用らしい。よくわからん。

Sagemaker_pred1.PNG

Sagemaker_pred2.PNG

CI/CD

  • SageMaker Pipelines

まとめ

今回は、SageMakerについてまとめた。

参考文献

補足

AWSの最新情報や各サービスの情報は、下記サイトを参照している。

2
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
2