More than 5 years have passed since last update.

Kerasを乗せたDockerのイメージをECSでAPIとして利用するために、どのようなインスタンスを選択するべきか

Posted at 2017-04-14

あくまでも個人で実際に試した内容であり、これから環境を構築するという方に対しての一つの情報になればいいなと思っています。

環境

インスタンスタイプ	vCPU	メモリ
c4.xlarge	4	7.5
c4.4xlarge	16	30

ECSでのリソースの割り当ては以下

gunicornがkerasを積んだニューラルネットワークの計算を行うもの、nginx_gunicornはnginx

（微妙なリソースの割り当て割合の差とか出ていますが...）

Tsungを使って、予測するURLに負荷をかけてみました。
Tsungを積んだDockerで負荷テストを行う

テスト内容は、180秒で2秒間に1回ユーザーが新規にアクセスをするといった感じ

結論を言うと、今回はスケールアップした方が負荷に対して強かった。

少しグラフの見方があっているかわからないので、正しい確証ないのですがcloudwatchなどと照らし合わせて考えると、c4.xlargeで待ちうける場合、ある時点からレスポンスの時間が低下し始めタイムアウトが発生しエラーが右肩上がりに増える。

最適なリソースの割り当てが、どうするべきかまだDocker運用もニューラルネットワーク用の数値計算ライブラリの運用もペーペーなので、最適解があれば教えて欲しいです