株式会社オズビジョンの@terra_yuccoです。
2016年度下期のミッションの一つに、プロダクトの監視整備というお仕事をまかされました。
がんばります。(決意表明)
とはいえ、監視の目的もはっきりしておらず、サービス自体のSLAも明確に規定されておらず、
今の水準のものを広げていくだけで良いのかもはっきりしておらず…
まずはできることとして、「イマドキのWebサービス」は、どんな体制でやっているのかを調べることにしました。
各会社の採用プロダクト
- WEB系各社で使われている監視ツールまとめ << 超!良エントリ
ツールごとの特徴
調べてみて思ったこととして、ぶっちゃけ、どれを使うにしても、
「頑張れば何でもできる」とは思いました。
Nagios
- メリット
- 現在利用中
- 検知時トリガ処理なども仕込めるので、作り込みを覚悟すれば何でもできる
- デメリット
- 設定ファイルがテキストベースで少し扱いづらい
- AWSからyumできるバージョンが日本語対応していない
- Nagios-pluginsが他のyumと競合することが(まれに)ある
- 基本的にPull型監視
Munin
- 「Muninでかんたんサーバー監視」~初心者でもよくわかる!VPSによるWebサーバー運用講座(3)
- メリット
- 導入は簡単そう
- デメリット
- どっちかと言えばviewが評価されている印象で、監視能力に特筆するものは無さそう
Zabbix
- NagiosとMuninを両方合わせたことができる
- メリット
- WEB+DB PRESS Vol.94 でもAWSの監視として取り上げられていた
- 資料が多い
- エージェントをインストールすれば勝手に監視対象に追加してくれる
- デメリット
- Nagiosの資産がそのままは使えない
- PostgreSQLが必要
Sensu
- メリット
- エージェントを入れればPushで通知してくれる監視なのは良い
- Nagiosの資産を利用できる
- Uchiwaで複数Sensuをまとめられるのはとてもよい
(メインプロダクトの本番/開発、新規事業などいろいろな軸があるので)
- デメリット
- ただし設定やセットアップが煩雑という声がある
AWS CloudWatch
- メリット
- AWSのマネージドサービス
- カスタムメトリクスを使えば比較的なんでもできるとは思う
- デメリット
- APIのリクエスト制限
- 必要な値は自分で登録の仕組みも作る必要がある
Hinemos
- NTT DATA製、国産ツール
- メリット
- Jobの運用監視ができる
- AWS対応も一応あり
- デメリット
- 監視項目の追加が難しい
- これだけ高機能なのに利用されていないのにはそれだけの理由がありそう
New Relic
-
パフォーマンス監視サービスのNew Relicが超便利な件
- このエントリに書いてあるけれども、死活監視というよりパフォーマンス監視のツール
Mackerel
- 有料なので試せてない。ただし国産ツール
おわりに
今のところ、Nagiosから乗り換えるならまずはZabbixかなという気がしていますが、
もしおすすめがあればぜひ教えてください!
おしまい。