AWS EC2にAI開発基盤KAMONOHASHIを構築する

Last updated at 2020-03-27Posted at 2019-06-03

OSSのAI開発基盤KAMONOHASHIをAWS EC2に構築してみます。
オンプレ前提のインストーラのため、構築に少し手間がかかります。

手順概要

お試しで構築する想定なので、セキュリティなどはいろいろ省略します。
KAMONOHASHIはバージョン1.0.0を使います

EC2インスタンスを作ります
- EC2インスタンスのの作成でAMIは Ubuntu 16.04 x86を選びます
- インスタンスタイプはドキュメントの表に従って選択します
  - KAMONOHASHIノードはc5.xlarge、k8s,storageはt3a.small、GPUはg3s.xlargeなどになります
- インスタンスの設定タブで、cloud init機能による初回起動時のapt updateを設定しておきます。
  - インストーラーがエラーにならないおまじないです。
    これをユーザーデータ欄に貼り付けでください
    #cloud-config package_upgrade: true
- 確認と作成からEC2インスタンスを作成します
  - すべて同じキーペアを指定してください
セキュリティグループを設定します
- 内部通信(デフォルトVPCでは172.31.0.0/16)はすべて許可します。このサブネットはVPCに応じて設定してください。
- 外部からssh, 80(webアクセス)、9000(ストレージアクセス)のTCPポートを開けておきます
  - 簡単のため、すべてのEC2インスタンスで同じ設定とし、任意のGlobal IP を許可します
sshでGPU用インスタンスに入り、NVIDIA DRIVERをインストールします

/var/lib/kamonohashi/deploy-tools/1.0.0/kamonohashi/deploy-kqi.sh cleanを実行してKAMONOHASHIのコンテナを止めます
vi /var/lib/kamonohashi/deploy-tools/1.0.0/kamonohashi/conf/settings.ymlを実行します
- virtualHostsの部分のプライベートのホスト名をKAMONOHASHI用インスタンスのパブリックのホスト名に書き換えます
  - before
  - after
/var/lib/kamonohashi/deploy-tools/1.0.0/kamonohashi/deploy-kqi.sh deployを実行してKAMONOHASHIのコンテナを起動します
上記で設定した外部host名でログインします
- ストレージ設定のDefault-storageを編集し、サーバー名URLをストレージ用EC2インスタンスのパブリックのホスト名に書き換えます

以上です。あとはチュートリアルを実行して動作確認してみましょう