1. はじめに
仮想マシンなどCompute作成時にユーザーデータ(User Data)を指定したことがあるだろうか。ユーザーデータを使うと、簡単にLinux OSを設定できる。便利なわりに使われていない気がするので、ユーザーデータ/cloud-initについて説明する。
1-1. TL;DR
- cloud-initを使うと、簡単にLinux OSの初期設定ができる
- cloud-initの仕組みは各所で解説されているが、利用者にとってコンパクトで実践的なものは少ない
- 実践的なサンプルや、自力で書くときの参考情報を提供することで、活用のきっかけになりたい
1-2. 前提条件
- cloud-initが利用可能な環境(パブリック・クラウドに限らず、一部のプライベート・クラウドでも利用可能)
- Linux OSイメージ
2. なぜ、cloud-init ?
IaaSにおいて、本格的なOS設定の自動化やInfrastructure as Codeを目指すならば、AnsibleやChef、Puppet等の構成管理ツールが最適だ。またWebサーバなど、同一構成のサーバーをたくさん複製するにはカスタム・イメージ(カスタムAMI)が適している。
ただし実際の現場では、Ansibleなどの構成管理ツールを導入するほどではないけれど、ちょっとしたOS設定を変更したいことがある。
そのようなときに便利なのがcloud-initだ。もともとはAmazon EC2用に開発されたツールだが、現在はクラウドでLinux OSを設定する一般的なツールになっている。VMware vSphereやOpenStackでも使用できる。
またAnsibleなどの構成管理ツールを使うときでも、利用準備を整える前処理としてcloud-initを組み合わせて使うこともできる。
次の図はユーザーデータ(User Data)とcloud-initの関係を表した図だ。インスタンス作成時にユーザーデータを指定すると、OSイメージに組み込まれたcloud-initがユーザーデータの内容を実行することで、OSの初期設定ができる。
ユーザーデータ(User Data)とcloud-initの関係
ヒント
もともとcloud-initは、Amazon EC2インスタンスを迅速かつ簡単、確実に設定するツールとしてBrandon Fuller氏らが開発したものだ。そのことがブログ「The beauty of cloud-init」に書かれている。
またcloud-initのメインメンテナーは、Ubuntuを開発するCanonical Server Teamなので、Ubuntu用のモジュールが充実している。
3. cloud-initができること
3-1. cloud-initで使用できる書式
cloud-initでは複数の書式を使用できる。その中でも、よく使うのはシェルスクリプトとcloud-configだ。シェルスクリプトは当たり前なので省略するとして、今回はcloud-configについて説明する。
cloud-initでよく使う書式
書式 | 特徴 |
---|---|
シェルスクリプト | 既存のノウハウや資産を生かせる。#! で始まるスクリプトならば使用可能 |
cloud-config | YAML形式で簡潔に書け、OSの差異を吸収できる |
MIMEマルチパート形式 | シェルスクリプトとcloud-initを同時に使うなど、複数の書式を併用できる |
3-2. cloud-configとは
cloud-configとは、YAMLで簡潔にOS設定を記述できる機能だ。次の例ではタイムゾーンを東京に設定している。
#cloud-config
timezone: Asia/Tokyo
ここで注目することが二つある。一つ目は#cloud-config
で始まっていること。これはcloud-configの書式で記述することを宣言している。
二つ目はタイムゾーンの指定方法。たとえばCentOS 6とCentOS 7ではタイムゾーンの設定方法は異なる。ところがcloud-configのtimezoneモジュールがOSの違いを吸収するため、まったく同じ記述を利用できる。
またtimezoneモジュールは複数のLinuxディストリビューションに対応しているので、RHEL系だけでなくUbuntuでも利用できる。
3-3. cloud-initの実行タイミング
基本的には 「インスタンス作成後の初回起動時に1回だけ実行する」 と覚えていいだろう。例外もあるのだが、今回説明する範囲は、この理解で問題ない。
もう一つ覚えておくべきことは 「OSのインストールが終わったあとに実行される」 ことだ。1回だけ実行される/etc/rc.local
のようなものと考えてもいいだろう。
Linuxのサイレント・インストール・ツールKickstartとは異なるタイミングで実行されることは覚えておきたい。詳細は以下のエントリを参照のこと。
4. cloud-configチュートリアル基本編
それではcloud-configの記述例を紹介する。今回の環境ではCentOS 7と、以下のバージョンのcloud-initを使用している。
# cloud-init --version
/usr/bin/cloud-init 18.5
# python -V
Python 2.7.5
2021/06/10追記
CentOS 8とPython 3.6.8の組み合わせでも同じ結果になることは検証済み。
4-1. cloud-config作成の基本
cloud-configを作成する手順は以下のとおり。
2.モジュールのページで、自分が使うディストリビューションに対応しているか確認する。次のようにallになっていれば大丈夫だ。
Supported distros: all
また以下のようにonce-per-instanceと書かれていれば、初回起動時に1回だけ実行される。
Module frequency: once-per-instance
基本を理解したところで、次からは実際のサンプルを紹介しよう。
4-2. タイムゾーンとロケールを設定する
この設定ではタイムゾーンを東京、ロケールを日本語に設定している。timezoneもlocaleも複数のディストリビューションに対応しているので汎用的に利用できる。
#cloud-config
timezone: Asia/Tokyo
locale: ja_JP.utf8
注意
タイムゾーンを変更したときはリブートすることを推奨する。なぜならば起動中のサービスには反映されないからだ。
たとえばsyslogのタイムスタンプは 「変更したタイムスタンプ」 では無く 「UTC」 のままになっている。そのため、次のようにサービスを再起動したほうがよいだろう。
systemctl restart rsyslog
4-3. パッケージを追加する
パッケージを追加インストールするときには、次のようにpackages
のあとにパッケージ名を記述する。
#cloud-config
timezone: Asia/Tokyo
locale: ja_JP.utf8
packages:
- man-pages-ja
- multitail
- nmap
- nc
- tmux
- tree
ただしパッケージの追加やアップデートは、メタデータの同期やインストールに時間がかかることがある。そのためインスタンスの起動直後は実行されていない可能性がある。
実行状況は/var/log/cloud-init.log
で確認できる。次のようにfinish: modules-final
が出力されれば終了している。
# tail -f /var/log/cloud-init.log
★ここから下は画面の出力★
2019-05-16 23:04:25,343 - util.py[DEBUG]: Read 14 bytes from /proc/uptime
2019-05-16 23:04:25,343 - util.py[DEBUG]: cloud-init mode 'modules' took 0.208 seconds (0.21)
2019-05-16 23:04:25,344 - handlers.py[DEBUG]: finish: modules-final: SUCCESS: running modules for final
4-4. パッケージをアップデートする
yum update
を実行するときは、以下のようにpackage_upgrade
の行を追加する。
#cloud-config
timezone: Asia/Tokyo
locale: ja_JP.utf8
package_upgrade: true
packages:
- man-pages-ja
- multitail
- nmap
- nc
- tmux
- tree
注意
パッケージをアップデートしたときは再起動を推奨する。なぜならば、kernelやglibcなどは、再起動しないと有効にならないからだ。
4-5. ファイルを追記/作成する
ほかに使うものとしてはwrite_filesモジュールがある。詳しくはドキュメントを読んで欲しいが、次の例は新規作成と追記である。
write_files:
- content: |
# My new /etc/sysconfig/samba file
SMDBOPTIONS="-D"
path: /etc/sysconfig/samba
- content: |
15 * * * * root ship_logs
path: /etc/crontab
append: true
4-6. 実行後に自動で再起動する
注意:
現時点では希望通りに動作しないことがある。必ず再起動したいときは後述のruncmdを使用すること。このあたりのことは今後別エントリで説明予定だ。
パッケージをアップデートすると、kernelやglibcが更新される可能性がある。そのときに便利なのがpower_state
だ。cloud-init実行後に自動で再起動できる。
以下のようにdelay:"+10", timeout:30
と指定した場合、cloud-init終了後30秒間のタイムアウト時間ののち、10分後に再起動される。
Oracle Linuxの場合、Kspliceのためにkernelアップデートに時間がかかるので、delayは5分未満に設定しないことを推奨する。
#cloud-config
timezone: Asia/Tokyo
locale: ja_JP.utf8
package_upgrade: true
packages:
- man-pages-ja
- multitail
- nmap
- nc
- tmux
- tree
power_state:
delay: "+10"
mode: reboot
message: Bye Bye
timeout: 30
5. cloud-configチュートリアル応用編
cloud-initのマニュアルを見ると、現時点ではcloud-configのモジュールの数が少なく設定できない項目も多い。そのためシェルスクリプトを書こうとしたとき、三つの選択肢がある。
- cloud-configをやめて、全部シェルスクリプトで書く
- MIMEマルチパート形式で書いて、cloud-configとシェルスクリプトを併用する
- cloud-configのruncmdを使用する
このなかで便利なのがruncmdだ。制限事項はあるがスクリプトを記述できる。つまりcloud-configの利便性と、シェルスクリプトの自由度の高さを活用できるのだ。そこでruncmdの使い方を説明する。
なお今回は取り上げないが、MIMEマルチパート形式はcloud-utilsパッケージのwrite-mime-multipartコマンドを使えば作成できる。
5-1. runcmdの使い方
マニュアルに載っているサンプルは以下のとおり。ハイフン以降の各行が、それぞれのコマンドである。
runcmd:
- [ ls, -l, / ]
- [ sh, -xc, "echo $(date) ': hello world!'" ]
- [ sh, -c, echo "=========hello world'=========" ]
- ls -l /root
- [ wget, "http://example.org", -O, /tmp/index.html ]
この例を見ても分かるように、カギ括弧以降に配列で書く方法と、ハイフン以降に直接書く方法がある。いずれもroot権限で実行され、後者の場合にはshで実行したとみなされる。
分かりやすさの点から、今回は直接記述する方法を採用する。そして注意事項を2点ほど。
- YAML形式なのでコロン(:)が含まれるときは、ダブルクオーテーションなどでクオートする必要がある。
-
既存のファイルをsedで書き換えるときは、シンボリックリンクではなく、実体のフルパスを指定すること。sedで書き換えると実ファイルになり、リンクが切れてしまう。システム系のファイルは互換性のためシンボリックリンクが多いので要注意。なおsedに
--follow-symlinks
オプションを付けることで、シンボリックリンクのリンク切れを防止できる。
runcmdは約100行のPythonスクリプトなので、興味のある人は読んでみては。
/usr/lib/python2.7/site-packages/cloudinit/config/cc_runcmd.py
5-2. SELinuxを無効にする
OCI ComputeやAzure Virtual MachinesではデフォルトでSELinuxが有効になっている。runcmdでSELinuxを無効化する。
#cloud-config
timezone: Asia/Tokyo
locale: ja_JP.utf8
runcmd:
- setenforce 0
- sed -i -e 's/^\SELINUX=enforcing/SELINUX=disabled/' /etc/selinux/config
- systemctl restart rsyslog
5-3. ファイアウォールを無効にする
OCI Computeではデフォルトでfirewalld/iptablesが有効になっている。SELinuxに加えてファイアウォールを無効化する。ただし6系と7系では設定が異なる。
CentOS 7/Oracle Linux 7の場合
#cloud-config
timezone: Asia/Tokyo
locale: ja_JP.utf8
runcmd:
- setenforce 0
- sed -i -e 's/^\SELINUX=enforcing/SELINUX=disabled/' /etc/selinux/config
- systemctl stop firewalld
- systemctl disable firewalld
- systemctl restart rsyslog
CentOS 6/Oracle Linux 6の場合
#cloud-config
timezone: Asia/Tokyo
locale: ja_JP.utf8
runcmd:
- setenforce 0
- sed -i -e 's/^\SELINUX=enforcing/SELINUX=disabled/' /etc/selinux/config
- service iptables stop
- chkconfig iptables off
- service rsyslog restart
6. クラウドサービスでの指定方法
参考までに、AWSとAzure、Oracle Cloud Infrastructureでの指定方法を紹介する。クラウドの画面はよく変わるので、参考として捉えてほしい。
6-1. Amazon EC2でユーザーデータ(User data)の指定方法
6-2. OCI Computeでユーザーデータ(User data)の指定方法
- Compute作成ページの一番下で**[Show Advanced Options(拡張オプションの表示)]**をクリックする。
2.ページが拡張され、User dataを入力できるようになる。ファイルを指定するか、直接スクリプトを貼り付ける方法がある。
6-3. Azure Virtual Machinesでユーザーデータ(User data)の指定方法
Azureでのcloud-initサポートは下記リンクを参照のこと。Linux OSでもバージョンによってはcloud-initをサポートしていないことがある。またWebUIでは指定できないが、CLIだけで指定できることもある。
7. おわりに
ここまで読んで
「おれはインスタンス作成後に、コマンドのコピペでOK」
と思う人もいるかも知れない。筆者も過去のエントリで、コマンドのコピペ用バージョンを紹介している。
cloud-initの魅力は、インスタンス作成と同時に設定できること(fire and forget)と、汎用性が高く簡潔に書けることだろう。社内やグループ内のポータルなどに典型的なパターンを紹介しておけば再利用されることも多いのではないだろうか。
8. まとめ
- ユーザーデータ/cloud-initを使用すると、インスタンス作成時にLinux OSを設定できる
- シェルスクリプトやcloud-configなど複数の書式を利用できる
- cloud-config書式ではシンプルで汎用性の高い記述ができる
- rumcmdを使うと、cloud-conifg内にOSコマンドを記述できる
- LinuxのKickstartはOSインストール時に実行されるが、cloud-initはOS起動開始後に実行される。そのため時間のかかる処理を記述すると、すべての設定が反映されるまでタイムラグがある
9. 次は?
デバッグ編はこちら。
10. 参考
- cloud-init公式サイト
- cloud-init公式マニュアル
- AWSドキュメント:Linux インスタンスでの起動時のコマンドの実行
- Azureドキュメント:チュートリアル - Azure での Linux 仮想マシンの初回の起動時に cloud-init を使用してカスタマイズする方法
- An Introduction to Cloud-Config Scripting
- How To Use Cloud-Config For Your Initial Server Setup
- Automating Openstack with cloud init run a script on VM's first boot
- cloud-init の設定を上書き、拡張する方法