More than 1 year has passed since last update.

SageMakerでのデプロイメント(1/2): SageMakerデプロイについて

Posted at 2024-07-02

背景

機械学習プロジェクトで、GPUを使ったサーバーが必要になりました
仕様としてサーバーで行う処理はジョブ形式で、常時サーバーを起動しておく必要はありませんでした
そこで、AWSのSageMakerを使うことにしました。SageMakerは、機械学習モデルの構築、トレーニング、デプロイを効率的に行えるサービスで、コストも抑えられます。

この記事では、SageMakerについての基本的な情報や、私が参考にした記事を紹介します。

SageMakerはフルマネージドのMLサービスです. SageMakerによって、データサイエンティストはMLモデルの構築・学習・デプロイを本番環境レベルの環境で高速に行うことが可能になります.

SageMakerでは以下の処理を行うことができます。

今回の記事では、モデルのデプロイ に焦点を当てています。

SageMakerデプロイには大きく分けて4種類あります

使い分けは以下のフローチャートから

(※1) SageMaker用のContainer Image一覧: https://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg-ecr-paths/ecr-ap-northeast-1.html
(※2) SageMakerのモデル: AWSのコンソールの SageMaker -> 推論　-> モデルで表示されるオブジェクト
(※3) エンドポイント設定: AWSのコンソールの SageMaker -> 推論　-> エンドポイント設定で表示されるオブジェクト

色々書いてきましたが以下のyoutubeで、デプロイの全体像がめちゃくちゃわかりやすく説明されています

この動画を見てサンプルのScikit-Learnコンテナや、Pytorchコンテナのデプロイまで一通りやるとかなり理解が深まります.

Python Libraryでのデプロイサンプルコードもありますが、基本的にはboto3でのデプロイサンプルで挙動を把握していくことをお勧めします. 非同期推論や、バッチ推論のサンプルはboto3でのものが多いですし、挙動の詳細がよくわかります.