More than 1 year has passed since last update.

EC2のAuto Scalingとスポットインスタンスの設定を試してみる

Posted at 2024-08-16

以下の記事で以前EC2のスポットインスタンスやスポットフリート関係について軽く調べたり触れてみました。

本記事では追加でAuto Scalingとスポットインスタンスを絡ませた設定を試していってみます。調べてみてスポットフリート的なものも絡ませた設定などもできそうであれば使用してみます。

インフラ・クラウド回りは初心者なので知識が荒い点などはご容赦ください。

※基本的にマネジメントコンソール上での操作を試していきます。CloudFormationを利用した設定などは機会があれば別の記事で対応しようと思います。

まずは起動テンプレートを作成

まずはスポットインスタンスなどの起動時に使うための起動テンプレート（Launch template）を追加していきます。Auto Scaling設定時とかに使用します。

EC2の画面の左メニューからLaunch Templatesを選択しCreate launch templateをクリックします。

今回はお試しなのでテンプレート名はTestTemplate1としておきます。

Auto Scaling guidanceという箇所でもしAuto Scalingで使おうとしている場合にはチェックを入れてくださいといった説明のものがあるのでチェックを入れてみます。

通常のインスタンス起動時と同じようにOSの選択のUIがあるので今回はARM版のUbuntu 24.04にしておきます。

インスタンスタイプの選択のUIがありますが起動テンプレートで設定しない形（Don't include in launch template）もできるようなのでそちらを設定しておきます（Auto Scaling経由とかで起動したときに設定されるようにします）。

その他の設定も割愛気味で進めてCreate launch templateをクリックして起動テンプレートを作成しておきます。

正常に作成されました。

EC2のAuto Scalingグループを作成する

続いてEC2のAuto Scalingグループを作成していきます。

EC2のページの左メニューからAuto Scaling Groupsを選択し、Create Auto Scaling groupボタンをクリックします。

名前はTestAutoScalingGroupとしておきます。

起動テンプレートは前節で触れたものを設定しておきます。なお、バージョンが表示されているので起動テンプレートにバージョン設定もできそうですね・・・。この辺も後日機会があれば触ってみるかもしれません。

続いてインスタンスタイプを設定していきます。

インスタンスの属性で設定する場合（Specify instance attributes）にはvCPU数やメモリの最小～最大値の範囲でインスタンスが選択される形になると思われます。

インスタンスタイプを指定する場合（Manually add instance types）には使いたい個々のインスタンスタイプと重み付け設定（Weight）を指定していきます。

Weightの設定はスペックに応じてどのくらいのキャパシティのインスタンスなのかで設定していきます。例えばnanoで1を設定すればその上のmicroは2、smallは4・・・といった具合です。

GPUインスタンスなどでGPU枚数などが変則的なインスタンスファミリーを使う場合にはGPU1枚で1、2枚で2、4枚で4・・・といったようにWeightを設定していく形でもいいのかもしれません。

t4gなどのバースト可能なファミリーも少々変則的な感じになりますが、今回はお試しなので安いt4gファミリーで設定していってみます。

Instance purchase optionsではオンデマンドインスタンスとスポットインスタンスの比率を設定できるようです。たとえば2割はオンデマンド、残り8割はスポットインスタンス・・・みたいな設定ができるようです。便利そうですね。

また、Include On-Demand base capacityのところに0以外のインスタンス台数を指定しておけば比率に関わらず一定数のオンデマンドインスタンスが確保される・・・といったところでしょうか？
要検証ですがスポットインスタンス比率を100％にしてInclude On-Demand base capacityの方を2台にしておけばオンデマンドは2台確保、残りは全部スポットで運用・・・みたいな形もいける感じでしょうか？

中断されてもOKなように作りつつスポットインスタンスメインで扱って、そしてオンデマンドも少し混ぜておく形にして緊急の際にはオンデマンド台数を増やす・・・とかもいいかもしれませんね。
（スポットインスタンスが安定するように必要なスポットプール数は確保しつつ、それでも万一スポットインスタンスが必要数確保できない場合にいつでもオンデマンド数を増やせるようにしておくなど）

On-Demand allocation strategyはオンデマンドインスタンス起動時のインスタンスタイプ選択方針設定のようです。Prioritizedを選択した場合には選択できるインスタンスタイプの中で先頭のインスタンスタイプ、Lowest priceは安いインスタンス・・・といったところでしょうか。

Spot allocation strategyではスポットインスタンス側のインスタンスタイプ選択の方針を設定できます。前記事で触ったスポットフリートの設定で触れた時と同じような内容になります。

基本的には何か理由がなければ推奨されているコスト効率が一番良いもの（Price capacity optimized）を選択しておけばOKかなという印象です。

また、キャパシティリバランスの設定もスポットフリート設定画面と同じようにAuto Scaling側の画面に存在するようです。

その他ネットワークに関してはスポットインスタンスの選択肢が増えた方が好ましいのですべてのアベイラビリティゾーンのサブネットを選択しておきます。

続いてロードバランサーの設定となりました。
今回検証で使っているAWSアカウントだとまだロードバランサーは作っていなかったのですが、どんな設定があるのかの確認用に試しにALBを新規作成していく形で試してみるためAttach to a new load balancerを選択します。

Load balancer typeはApplication Load Balancerを選択し、TestAutoScalingGroupLoadBalancerと名前を付けておきます。

ALBのターゲットグループ設定も新規作成する形にしておきます（今回は80ポートでサーバーを立てたりはしない想定なのでヘルスチェックは通らない形になりますが・・・）。

Default instance warmupの設定でAuto Scalingがメトリクスによる判定とかに使うまでの猶予秒数が設定できるようです。起動して準備が完了するまでにぼちぼちかかるケースなどでは設定しているといいのかなと思います。

Desired capacityにはスケーリングの初期値の指定が必要なようです。少し前にインスタンスタイプとWeightの設定をしましたが、その単位での重み分が確保されるようになると思われます。今回はt4g.nanoでWeightが1にしたのでDesired capacityが4なら4台（もしくは別のインスタンスタイプならもっと少ない数のインスタンス）が起動するかと思われます。

Scaling limitsの設定ではスケーリングで最小キャパシティと最大キャパシティを設定できるようです。負荷に応じてこの範囲でWeightを参照して台数が変動する形になるかと思われます。

Instance maintenance policyではリバランス時などにインスタンスの入れ替わりが発生するときの方針を設定できるようです。前記事で触れたスポットフリートでもあったような設定となります。終了（破棄）前に追加のインスタンスを起動するのか、終了してから起動するのかなどを選択できます。

終了前に起動したりするオプションなどではどのくらい余分にヘルスチェックの分を確保してもOKかの最大値設定もできるようです。入れ替え対象が多い場合にこのパーセンテージが大きい方が同時にたくさんの余分なインスタンスを起動できて短時間で処理が終わる・・・とかでしょうか・・・？この辺りは将来もし必要になったら詳しく調べようと思います。