Edited at

Amazon SageMakerでml.p2.xlargeを使おうとしたらResourceLimitExceededって怒られた

More than 1 year has passed since last update.


事象

Amazon SageMakerで ml.p2.xlarge を使って学習させようとしたら以下のエラーが出て学習ができなかった。

ResourceLimitExceeded: An error occurred (ResourceLimitExceeded) when calling the CreateTrainingJob operation: 

The account-level service limit for training-job/ml.p2.xlarge is 0 Instances, with current utilization of 0 Instances and a request delta of 1 Instances.
Please contact AWS support to request an increase for this limit.


原因

AWSでは利用できるリソースに制限があります。

詳しくはこちらのページをご確認ください。

Amazon SageMakerにも制限があり、こちらでは ml.p2.xlarge インスタンス のデフォルトの制限は 1 となっています。


対策

AWSのサポートに連絡して制限を緩和してもらいましょう。


  1. AWSのコンソールにログイン

  2. 右上の サポート から サポートセンター のページを表示


  3. ケースの作成 を押下

  4. 内容で サービス制限の増加 を選択

  5. 制限タイプで SageMaker を選択

  6. リージョン、リソースタイプ、制限をそれぞれ選択

  7. 新しい制限値を入力

  8. 適当に理由を書いて 送信 を押下

1営業日程度で対応してくれます。

海外のリージョンの申請は海外の担当部署と調整が必要らしく、少し時間がかかるかも

他のサービスも色々制限があったりするので、申請方法を覚えておきましょう。