事象
Amazon SageMakerで ml.p2.xlarge
を使って学習させようとしたら以下のエラーが出て学習ができなかった。
ResourceLimitExceeded: An error occurred (ResourceLimitExceeded) when calling the CreateTrainingJob operation:
The account-level service limit for training-job/ml.p2.xlarge is 0 Instances, with current utilization of 0 Instances and a request delta of 1 Instances.
Please contact AWS support to request an increase for this limit.
原因
AWSでは利用できるリソースに制限があります。
詳しくはこちらのページをご確認ください。
Amazon SageMakerにも制限があり、こちらでは ml.p2.xlarge インスタンス
のデフォルトの制限は 1
となっています。
対策
AWSのサポートに連絡して制限を緩和してもらいましょう。
- AWSのコンソールにログイン
- 右上の
サポート
からサポートセンター
のページを表示 -
ケースの作成
を押下 - 内容で
サービス制限の増加
を選択 - 制限タイプで
SageMaker
を選択 - リージョン、リソースタイプ、制限をそれぞれ選択
- 新しい制限値を入力
- 適当に理由を書いて
送信
を押下
1営業日程度で対応してくれます。
海外のリージョンの申請は海外の担当部署と調整が必要らしく、少し時間がかかるかも
他のサービスも色々制限があったりするので、申請方法を覚えておきましょう。