AWS
SageMaker

Amazon SageMakerでml.p2.xlargeを使おうとしたらResourceLimitExceededって怒られた

事象

Amazon SageMakerで ml.p2.xlarge を使って学習させようとしたら以下のエラーが出て学習ができなかった。

ResourceLimitExceeded: An error occurred (ResourceLimitExceeded) when calling the CreateTrainingJob operation: 
The account-level service limit for training-job/ml.p2.xlarge is 0 Instances, with current utilization of 0 Instances and a request delta of 1 Instances. 
Please contact AWS support to request an increase for this limit.

原因

AWSでは利用できるリソースに制限があります。
詳しくはこちらのページをご確認ください。

Amazon SageMakerにも制限があり、こちらでは ml.p2.xlarge インスタンス のデフォルトの制限は 1 となっています。

対策

AWSのサポートに連絡して制限を緩和してもらいましょう。

  1. AWSのコンソールにログイン
  2. 右上の サポート から サポートセンター のページを表示
  3. ケースの作成 を押下
  4. 内容で サービス制限の増加 を選択
  5. 制限タイプで SageMaker を選択
  6. リージョン、リソースタイプ、制限をそれぞれ選択
  7. 新しい制限値を入力
  8. 適当に理由を書いて 送信 を押下

1営業日程度で対応してくれます。
海外のリージョンの申請は海外の担当部署と調整が必要らしく、少し時間がかかるかも

他のサービスも色々制限があったりするので、申請方法を覚えておきましょう。