AWS SageMakerとは
Amazonが提供するサービスのひとつ。科学計算や機械学習の用途で使用されるソフトウェアを構築してくる完全マネージド型サービス
AWS SageMakerによって構築された環境は、機械学習のためのモデル訓練やデプロイだけでなく、JupyterNotebook、Jupyter LabによるPythonの開発環境も
提供してくれる。
https://aws.amazon.com/jp/sagemaker/
*またAWS上で動作しているために、パソコンのOSの違いを気にする必要はないというメリットがある。
Pythonライブラリとして利用するPyTorch、Chainer、Scikit-learn、SparkML、Horovod、Keras、Gluon などが標準で含まれている。
・ソフトウェア開発に必要なDockerを始めとしたソフトウェアも初期状態でインストールされている。
Google Cloud Machine Learning
サイズを問わず、あらゆるデータの機械学習モデルを簡単に構築できる
マネージド プラットフォーム(Google Cloud Platformで提供)
https://cloud.google.com/ml-engine/?hl=ja
AWS SageMakerサービス構成
#Ground Truth
→2018年に発表された新サービス
機械学習における典型的なタスクのためのデータセットの構築の支援を行うためのサービス
・ノートブック(NoteBook)
→開発・実行環境を提供
・トレーニング(training)
→機械学習におけるモデル作成のために必要なサービスを提供
AWS SageMaker Ground Truthは、機械学習用のラベルデータ作成を行うためのプラットフォームです。
・SageMaker Ground Truthでは、以下の種類のラベルデータを作成することができます。
Image Classification
Bounding Box
Text Classification
Semantic (Image) Segmentation
Custom
参照記事:https://www.inoue-kobo.com/aws/sagemaker-ground-truth/index.html
・推論(Inference)
→機械学習におけるモデルのデプロイのための必要なサービスを提供。
Web APIエンドポイントの設置など機械学習システムをサービス提供するために必要な機能群を提供。
バッチ処理によるジョブ登録もすることができる。
開発環境のセットアップ
-マネージメントコンソールから「sagemaker」と入力
・ノートブックのインスタンスを作成する
→IAMロールの設定など行う(AWSにおけるセキュリティ情報を集約して管理している)
→Amazon S3へのアクセスを許可する
使用料金
Amazon SageMaker では、使用した分のみ料金が発生します。構築、トレーニング、ホスティングは秒単位で課金され、最低料金や前払いの義務はない。
Amazon SageMaker の料金はオンデマンド ML インスタンス、ML ストレージ、ノートブックとホスティングインスタンスでのデータ処理料金に分かれている。
無料利用枠
AWS 無料利用枠の一環として、Amazon SageMaker の使用を無料で開始できる。Amazon SageMaker では、サインアップ後最初の 2 か月間、モデル構築のための notebook 利用に t2.medium インスタンスを 1 か月あたり 250 時間、トレーニングに m4.xlarge インスタンスを 50 時間、リアルタイム推論とバッチ変換用の機械学習モデルのデプロイに m4.xlarge インスタンスを合計で 125 時間、無料で使える。
無料利用枠は、初めて SageMaker リソースを作成した最初の月から始まる
Google Cloud Machine Learning の料金
→無料期間のトライアルも実施している
Googl Cloud MLでは、モデルのトレーニングや予測の実行に対して料金が発生します。ただし、クラウド内の機械学習リソースの管理は無料で行うことができます。各アクションの料金詳細を後に記述します。
アクション
米国
ヨーロッパ/アジア
モデル トレーニング
ML トレーニング ユニットごとに1時間あたり $0.49
ML トレーニング ユニットごとに1時間あたり $0.54
バッチ予測
予測1,000回あたり $0.10、プラス1時間あたり $0.40
予測1,000回あたり $0.11、プラス1時間あたり $0.44