Elasticsearch導入前に気を付けておきたいこと
はじめに
- Elasticsearchを仕事で使うことになったので導入前に考えるであろうことを調査・検証し、まとめてみました。
- 記載されている内容はほぼ公式ドキュメントから引っ張ってきています。それぞれの章にリンクを付けてありますので、記載されていること以外に気になる部分があればそちらを参照されるとよいと思います。
インストールについて
- ここで設定している内容はすべてansibleのスクリプトに落としてあります。
- 5分あればcurl,javaのインストール、Elasticsearchのインストール・初期設定、プラグインのインストールが終わるはずです。
- https://github.com/uzresk/ansible-elasticsearch2
環境
- CentOS6.7
- Java1.8.0_45
- Elasticsearch 2.1.1
HeapSizeの設定
- Elasticsearchが使うJavaのヒープサイズを設定する。目安は物理メモリの半分弱。xmsとxmxは自動的に同じ値が設定されます。嫌ならES_MIN_MEMとES_MAX_MEMを設定します。
/etc/init.d/elasticsearch
export ES_HEAP_SIZE=512m
File Descriptors
- Openできるファイルの数。「java.io.IOException: Too many open files」なんてメッセージはは大抵これが原因。
- 32K、64Kがおすすめ。Elasticsearch2.1のデフォルトでは65535になっており、起動スクリプト内で設定してあるので不足するようであれば追加する。
/etc/init.d/elasticsearch
MAX_OPEN_FILES=65535
- 設定の確認(OSからみる)
[root@es1 vagrant]# cat /proc/[ES processID]/limits
Limit Soft Limit Hard Limit Units
Max open files 65535 65535 files
~
- 現在どのくらいオープンしているか?
[root@es1 vagrant]# ls -l /proc/12831/fd/ | wc -l
93
- 設定の確認(ESからみる)
[root@es1 tms]# curl http://localhost:9200/_nodes/stats?pretty
仮想メモリ
- 1つのプロセスで使えるメモリマップの数の上限は「sysctl vm.max_map_count」で確認できる。デフォルトは65530
- linuxのデフォルトで足りない恐れがあるから上げたほうがよいとのこと。ちなみにrpmでインストールした場合は自動的にこの値が設定されるので設定は不要です。
- この値の妥当性がイマイチわかっていない。
sysctl -w vm.max_map_count=262144
メモリの設定
- JVMがスワップし始めるとElasticsearch(Lucene?)は重くなるようです。
- mlockallオプションを有効にすることで固定メモリで動くようにするのがよさそう。
- 起動スクリプトの中ではES_HEAP_SIZEの値をMAX_LOCKED_MEMORYに設定しているようでした。
/etc/elasticsearch/elasticsearch.yml
bootstrap.mlockall: true
- 設定を確認する(mlockall : trueになっていることを確認する)
[root@es1 vagrant]# curl http://localhost:9200/_nodes/process?pretty
{
"cluster_name" : "elasticsearch",
"nodes" : {
"qIwzWBwQSyessRMxjKM4GQ" : {
"name" : "Nitro",
"transport_address" : "10.0.2.15:9300",
"host" : "10.0.2.15",
"ip" : "10.0.2.15",
"version" : "2.1.1",
"build" : "40e2c53",
"http_address" : "10.0.2.15:9200",
"process" : {
"refresh_interval_in_millis" : 1000,
"id" : 13058,
"mlockall" : true
}
}
}
}
- これが有効にならない場合にどうするかという記事をネット上でちらほら見る。
- 公式ドキュメントによるとulimitの設定を行うとかtemporary directoryの場所を変更しろと書いてある。
Elasticsearchの設定
クラスタ名
- デフォルトはelasticsearch
/etc/elasticsearch/elasticsearch.yml
cluster.name: test-cluster
ノード名
- ノード名はデフォルトではMarvelのキャラクタ名がランダムに振られる。わかりにくいので設定しておく。
- ホスト名と一緒が良いのであれば${HOSTNAME}という感じで設定する
- ${prompt.text}を指定すると起動時にプロンプトが表示されノード名が入力できる。
/etc/elasticsearch/elasticsearch.yml
node.name: ${HOSTNAME}
ネットワークホストの設定
- これを設定しないとlocalhostからしかhttp接続できないので必ず設定する。
- どのホストからでもつなげる場合はこのようにする
/etc/elasticsearch/elasticsearch.yml
network.host: 0.0.0.0
- vagrant上ではnetwork.hostがeth0を指してしまうのでeth1を指すように変更しておく必要がある。
/etc/elasticsearch/elasticsearch.yml
network.host: '_eth1:ipv4_'
- network.hostを設定することで、network.bind_host(httpリクエストを受け付けるhost)、network.publish_host(クラスタ時にノード接続するために利用するhost)は同じものが設定される。詳しくはこちらを参照
- 接続要求はどこからでも受け付けるようにし、クラスタで利用するIPはeth1を利用するには以下のように設定する。
network.bind_host: 0.0.0.0
network.publish_host: _eth1:ipv4_
インデックスの格納場所
- デフォルトは/var/lib/elasticsearch。この下にnodes/0/_state/global-0.stという感じでインデックスが格納される。これを変更するにはこのようにする
/etc/elasticsearch/elasticsearch.yml
path.data: /var/lib/elasticsearch/
- data.pathはカンマ区切りで書くこともでき、複数のSSDに対してRAID0(ストライピング)するようなことも可能。どちらかが故障するとデータロストするので性能とのトレードオフ。
ログの出力場所
- デフォルトは/var/log/elasticsearch。これを変更するにはこのようにする
- 起動スクリプト内でもLOG_DIRという環境変数があるがelasticsearch.ymlの設定の方が強い
/etc/elasticsearch/elasticsearch.yml
path.logs: /var/log/elasticsearch/
クラスタ関連
- Elasticsearch2.0からはMulticastが廃止され、Unicastのみになりました。詳しくはElasticsearch Unplugged - 2.0におけるネットワークの変更(日本語訳)を読むと良い。
- unicastでクラスタメンバを見つけるための設定。デフォルトは以下のように自分しか登録されていない。
/etc/elasticsearch/elasticsearch.yml
discovery.zen.ping.unicast.hosts: ['127.0.0.1', '[::1]']
- スプリットブレイン対策。最小のマスタノード数を決める設定になり、計算式はn/2+1で設定する。1台構成の場合は1/2+1=1となります。
/etc/elasticsearch/elasticsearch.yml
discovery.zen.minimum_master_nodes: 1
ソフト・ハードコミット頻度の変更
- デフォルトでは1sec毎にコミットされるわけですがそんなに高頻度じゃなくても要件満たせる場合や巨大なindexを登録する場合は長く設定しておくことでindex更新時の負荷を減らす。
- 単位はs or msec(書かないとmsec) -1を設定することでコミットしなくなります。
- Dynamic Index Settings
[root@es1 tms]# curl -XPUT http://localhost:9200/[index name]/_settings -d '
index:
refresh_interval: 30s
'
{"acknowledged":true}
- ハードコミットの頻度はTranslogに記載されている。
- デフォルトのflushタイミングは、サイズが512mになったタイミングと5秒おき。
- その他操作の回数でflushするタイミングを決めることもできます。
Shard、Replicaについて
Shard
- indexを物理的に分割したもの。ノードごとに配置すると考えたほうがシンプル。ただし、一つのノードで複数shard持つことは可能。
- デフォルトは5。index作成後には変更できないのでindex作成時に指定してあげる。
- mapping.jsonで指定する場合は以下のようにする
{
"settings": {
"index": {
number_of_shards: 3,
number_of_replicas: 0
},
Replica
- PrimaryShardのコピーのことをReplicaShardという。PrimaryShardがダウンしたらReplicaShardがPrimaryShardに昇格する。
- 2台構成で冗長化を担保しようとするとshardの数が2.Replicaが1となる。
- 1台構成でelasticsearchを起動するとreplica先がないのでcluster healthがunhealthyになっている。これを解消するにはreplicaの数を0にすればよい。
- replicaの数については後で変更が可能
[root@es1 tms]# curl -XPUT 'http://localhost:9200/tms/_settings' -d '
index:
number_of_replicas: 1
'
memo
- ハードウェア故障に対する冗長性への対応はノード(=elasticsearchのプロセス)の数を増やし、ReplicaShardを増やすことで比較的対応は簡単。
- indexのサイズが非常に大きいとか更新頻度が多いという部分に関してはShardの数がポイントになってくるが、後では変更できないので将来を見越したサイジングが必要
- 参考になりそうなのはCapacity PlanningやElasticsearchのインデキシングに関するパフォーマンス検討
_allフィールドの無効化
- 元ネタはElasticsearchのインデキシングに関するパフォーマンス検討
- インデクシングされたデータはすべて_allに入るのでこれを無効化することでインデクシングのパフォーマンスが良くなる。
- マッピング定義にて以下のように記載すれば反映される
"_all" : {"enabled" : false},
ログ
- ログの設定は/etc/elasticsearch/logging.ymlで行う。log4jの要領で書けるので設定は難しくない。ローテートはやってくれるがファイルの削除はやってくれないのでshellなどを仕込みましょう。
- スローログの出力も可能なので必要に応じて設定する。
バックアップ&リストア
- 2台構成以上でレプリケーションを組んでいる状態であれば、サーバの物理障害に対する備えとしては十分だろう。2重障害を考えるのであればElasticsearchおすすめの3nodeでクラスタを組むのが良い。
- インデックスが壊れたとかおかしなデータが入ってしまったという所謂論理障害に対して備えをしておく必要がある。
- マニュアルを見る限りロールフォワードの機能はないのでバックアップ間隔分データがロストすることを許容する。RPOに厳しい場合だと別のデータソース(RDBやKVS)から差分データを戻してあげることを検討する必要があることが注意点。
- ここではelasticsearchのsnapshot機能を使ったバックアップ・リストアを考える
Backup
- snapshotを作るにはリポジトリをまずは作る必要がある。複数のバックアップを取得する場合は配列で記載することも可能。またパスの書き方はUNCでも書ける。
/etc/elasticsearch/elasticsearch.yml
path.repo: /var/lib/elasticsearch/backup
- my_backupという名前で/var/lib/elasticsearch/backupを認識させる
[root@es1 tms]# curl -XPUT 'http://192.168.1.41:9200/_snapshot/my_backup' -d '{
"type": "fs",
"settings": {
"location": "/var/lib/elasticsearch/backup",
"compress": true
}
}'
- リポジトリを登録する(/var/lib/elasticsearch/backup/my_backupディレクトリができるはず)
[root@es1 tms]# curl -XPUT 'http://192.168.1.41:9200/_snapshot/my_backup' -d '{
"type": "fs",
"settings": {
"location": "my_backup",
"compress": true
}
}'
[root@es1 my_backup]# curl -XPUT http://192.168.1.41:9200/_snapshot/my_backup/snapshot_1?WAIT_FOR_COMPLETION=true
{"accepted":true}
[root@es1 my_backup]# ls -l /var/lib/elasticsearch/backup/my_backup/
total 16
-rw-r--r--. 1 elasticsearch elasticsearch 28 Jan 7 01:09 index
drwxr-xr-x. 3 elasticsearch elasticsearch 4096 Jan 7 01:09 indices
-rw-r--r--. 1 elasticsearch elasticsearch 121 Jan 7 01:09 meta-snapshot_1.dat
-rw-r--r--. 1 elasticsearch elasticsearch 178 Jan 7 01:09 snap-snapshot_1.dat
- 取得したsnapshotの情報を個別、全件で取得するには以下のようにする
curl -XGET http://192.168.1.41:9200/_snapshot/my_backup/snapshot_1
curl -XGET http://192.168.1.41:9200/_snapshot/my_backup/_all
- snapshotの削除
curl -XDELETE http://192.168.1.41:9200/_snapshot/my_backup/snapshot_1
Restore
- snapshotからのリストアが可能です。
- ここではtmsという名前のindexをrestored_tmsという名前でリストアしている
[root@es1 my_backup]# curl -XPOST http://192.168.1.41:9200/_snapshot/my_backup/snapshot_1/_restore -d '
{
"indices": "tms",
"ignore_unavailable": "true",
"include_global_state": false,
"rename_pattern": "tms",
"rename_replacement": "restored_tms"
}'
- 名前を変えつつreplicaの数を変更することなんかもできます。
- ここではreplicaですけどrefresh_intervalの値など変えることもできます。当たり前かもしれませんがshardの数は変えられません。
[root@es1 my_backup]# curl -XPOST http://192.168.1.41:9200/_snapshot/my_backup/snapshot_1/_restore -d '
{
"indices": "tms",
"index_settings": {
"index.number_of_replicas": 1
},
"ignore_unavailable": "true",
"include_global_state": false,
"rename_pattern": "tms",
"rename_replacement": "restored_tms2"
}'
監視
リソース周り
- top(CPUがあふれてないか)
- iostat(IOがあふれていないか)
- ps,free,sar(メモリの使用量が一定か?swapしていないか)
- open_file_descriptors
- jvm(jstatとかで取得する。mlockall=trueなら優先度低)
- このへんも実はcurlで取れちゃうのです - NodeStats参照
サービス監視
- クラスタの確認はstatusがgreen or yellowであることを確認するとよさそう。springboot ActuatorのElasticsearchのhealthcheckのソースをみても同様だった。
[root@es1 tms]# curl -XGET http://localhost:9200/_cluster/health?pretty
{
"cluster_name" : "test-cluster",
"status" : "yellow",
・・・・
}
LBからのヘルスチェック
- LB配下に複数のノードをぶら下げるときにLBからのヘルスチェックのURLをどうするかを考える必要がある。がこれはちょっと悩んだ。
- _nodesにはノードが良い状態なのかを判断する術は用意されていないみたいだった。http://[IP]:9200/で200が返却されることでOKとみなして良さそう。つまり上記(サービス監視)に記載されているクラスタの監視のURLと同じでよさそう。
JMX
- 起動スクリプト内でES_JAVA_OPTSを設定する。
- mbeansの情報でelasticsearchの情報が特に何も得られるわけではないのと、そもそもelasticsearchの標準APIで色々取れるのであえてJMX経由で定期的に取るものはなさそうだ。
/etc/init.d/elasticsearch
export ES_JAVA_OPTS="-Djava.rmi.server.hostname=192.168.1.41 -Dcom.sun.management.jmxremote=true -Dcom.sun.management.jmxremote.port=7085 -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false"
その他
- CAT APIは便利そうなので押さえておきたい
コマンド(参考)
elasticsearchの状態を確認する
- クラスタ名、ノード名、NW周りの設定が見れる
[root@es1 ~]# curl http://localhost:9200/_nodes/process?pretty
mappingの登録
- mappingが作られた時点でシャードが作られる
[root@es1 tms]# curl -XPOST http://localhost:9200/[index name] -d @mapping.json
indexの登録(bulk)
[root@es1 tms]# curl -X POST http://localhost:9200/_bulk --data-binary @data.json
indexの削除
[root@es1 index]# curl -XDELETE 'http://localhost:9200/[index name]*'
indexの設定を確認する
[root@es1 tms]# curl -XGET 'http://localhost:9200/tms/_settings?pretty'