1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

SageMakerでのデプロイメント(1/2): SageMakerデプロイについて

Posted at

背景

  • 機械学習プロジェクトで、GPUを使ったサーバーが必要になりました
  • 仕様としてサーバーで行う処理はジョブ形式で、常時サーバーを起動しておく必要はありませんでした
  • そこで、AWSのSageMakerを使うことにしました。SageMakerは、機械学習モデルの構築、トレーニング、デプロイを効率的に行えるサービスで、コストも抑えられます。

この記事では、SageMakerについての基本的な情報や、私が参考にした記事を紹介します。

SageMakerとは

SageMakerはフルマネージドのMLサービスです. SageMakerによって、データサイエンティストはMLモデルの構築・学習・デプロイを本番環境レベルの環境で高速に行うことが可能になります.

スクリーンショット 2024-07-02 10.07.01.png

SageMakerでは以下の処理を行うことができます。

  1. データの前処理
  2. モデルの学習
  3. モデルのデプロイ

今回の記事では、モデルのデプロイ に焦点を当てています。

SageMakerのデプロイとは

SageMakerデプロイには大きく分けて4種類あります

  • リアルタイム
  • サーバーレス
  • 非同期
  • バッチ

使い分けは以下のフローチャートから

スクリーンショット 2024-07-02 10.09.55.png

デプロイの大まかな流れ

  • SageMaker用のContainer Image(※1)とMLモデルを組み合わせてSagemaker用のモデルを作成します
  • SageMaker用のモデル(※2)が作成とエンドポイント設定(※3)を使ってデプロイするとサーバーが用意されます

スクリーンショット 2024-07-02 10.09.49.png

詳細とGettingStarted

色々書いてきましたが以下のyoutubeで、デプロイの全体像がめちゃくちゃわかりやすく説明されています

この動画を見てサンプルのScikit-Learnコンテナや、Pytorchコンテナのデプロイまで一通りやるとかなり理解が深まります.

Python Libraryでのデプロイサンプルコードもありますが、基本的にはboto3でのデプロイサンプルで挙動を把握していくことをお勧めします. 非同期推論や、バッチ推論のサンプルはboto3でのものが多いですし、挙動の詳細がよくわかります.

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?