背景
AWS EC2インスタンスを起動するのは、チュートリアルや当サイトの記事、ブログ等々で簡単に行なえます。
しかし、GPUインスタンスクラスはデフォルトでは起動できないようになっており、そのために躓きました。
その際の対処について、ここに記しておきます。
先人たちの知恵をお借りするなどして解決できたことを、この場をお借りして感謝するとともに、大変恐縮ですが自分のメモとして、こちらへまとめておきます。
環境
(本番)
- AWS EC2 (Amazon Linux 2)
- Putty 0.74- AWS EC2 (Amazon Linux 2)
1.現象
GPUインスタンス(g4dn.xlarge など)が起動できない。
G4dn インスタンスは、機械学習推論やグラフィックを大量に使用するワークロードを高速化するために設計されています。
2.原因
マネジメントコンソールの EC2 において、画面左のサイドメニュー[制限]で確認できる「All G instances のオンデマンドを実行中」の "現在の制限" 欄が 0 vCPU となっているため。
3.対処
この "現在の制限" を 0→n へ変更する申請を行ないます。
画面左のサイドメニューより、[制限]をクリックします。
画面上部の検索窓に「G」と入力し検索すると、以下のように対象がある程度絞られます。
このうち、「All G instances のオンデマンドを実行中」を見付けて、ラジオボタンをONします。
画面右上の[制限緩和のリクエスト]ボタンをクリックします。
画面が遷移し、英語の画面が表示されます。
画面上部、中央の「Service limit inclease」のラジオボタンがONとなっていること、Case Detail欄で「EC2インスタンス」が選択されていることを確認し、画面下部の「Requests」欄へスクロールします。
※このとき、画面右上のリージョン名は「グローバル」となっていますが、間違いではありません。(「グローバル」から変更できません。)
requests欄は、以下の設定とします。
リージョン名: プルダウンから「アジアパシフィック(東京)」を選択
プライマリインスタンスタイプ: プルダウンから「All G instances」(GPUを利用できるインスタンスタイプ)を選択します。
New limit value: 任意 ※当記事での説明では「8」とします。
画面最下部までスクロールし、[Submit]ボタンをクリックします。
※「Case description」欄は未記入で問題ありません。
AWS側で受け付けたことを示すメールが届きます。
・1通目:
『内部レビューして承認するまで待ってて~』
というような内容。
・2通目:
『内部レビューして承認されたから、制限解除したよ~』
『30分ほどで使えるようになるからねぇ~』
というような内容。
私のケースでは、この2通のメールの間は約10分でした!
そして、使えるようになるまで30分とありますため、おやつ🍰&飲み物☕で、しばし休憩しましょう。
あとは、いつも通りの手順で、[インスタンスの起動]からインスタンスを起動するだけです。
途中で、"Gクラス" を選択することをお忘れなく。
(編集後記)
どのクラスのインスタンスも即座に起動できるものと思っていましたが、制限がかかっているとは露知らず。
この制限に気付くまでに思わぬ時間を費やしてしまいました。
制限緩和の申請から実際に利用可能(インスタンス起動可能)となるまでは、申請のタイミングや申請の混み具体で多少変動するかと思います。
利用したいときにすぐに利用可能とならない場合が考えられますので、利用が想定された場合はお早めに申請しておくことをオススメいたします。
皆様のご参考になれば幸いです。