NewRelic Server の概要
NewRelic Advent Calendar 2015 の5日目、担当はデジカの中島です。今日は、Servers というプロダクトについて、簡単に紹介したいと思います。
NewRelic のメインのプロダクトは APM だと思います。普通、NewRelic といえばこれをイメージする人が多いでしょう。APMはアプリケーションの中でモニタリングの処理が動きます。アプリケーションの内側から見ることで、非常に詳細な情報を取ることができるわけですが、これだけでは不十分です。サーバの能力不足など、問題がアプリケーションの外にある場合は、APMだけではわからないことがあります。
Serversは、その名の通り、サーバ全体のパフォーマンスやリソースの使用状況をグラフ化してくれます。APMを補完するプロダクトです。以下のような特色があります。
- インストールがすごく簡単
- 何もしないでも最初から欲しい情報が取れる
- Web UI がよくできている
ひとことで言えば「It just works」です。
これは、スティーブ・ジョブズが iPhone を説明するときに使った言葉ですが、マニュアルを読んだり、いろいろ考えなくても、「やってみりゃわかるさ」みたいな感じで、インストールすれば、そのまま使えるという感じです。
無料なので、とりあえず入れてみて損はないと思います。特に、インフラに専任できる人がいなくて運用面や監視が後回しになりがちで困っているような方にはオススメです。
インストール
まず、New Relicのトップページからサインアップしてみてください。最初に次のようなページが表示されます。
"SERVERS"をクリックしてみてください。インストール方法をガイドするページが表示されます。
自分が使っているサーバのOSを選択すると、下の方にインストールのコマンドが表示されます。ubuntu の場合は下記のようになります。
# echo deb http://apt.newrelic.com/debian/ newrelic non-free >> /etc/apt/sources.list.d/newrelic.list
# wget -O- https://download.newrelic.com/548C16BF.gpg | apt-key add -
# apt-get update
# apt-get install newrelic-sysmond
# nrsysmond-config --set license_key=(自分のライセンスキー)
# /etc/init.d/newrelic-sysmond start
ガイドのページには、実際のライセンスキーが埋め込まれて表示されているので、通常は、それをそのままターミナルに貼り付けて実行すればOKです。
ちなみに、ライセンスキーは、右上のアカウント名から Account Setting の Summary のページに表示されています。2台目以降のインストールでは、ここを参照してください。
なお、chef を使っている場合は、下記のコミュニティクックブックがあるのでさらに簡単です。
モニタリングページの概要
しばらくして、SERVERSのページに戻ると、今度は、インストールガイドでなく、次のようなページが表示されます。これがSERVERSのメインページです。
CPUやメモリの使用率がきれいなグラフで表示されます。
このグラフは、マウスカーソルを持っていくとその時点の数値が表示されます。
この時に、マウスカーソルがあるグラフだけでなく、他のグラフの数値も表示されます。ですから、「このCPU使用率がピークだった時のメモリの状況はどうだろう?」みたいなことが自然に読み取れます。実際に自分でこれを毎日使っている人が開発していることをうかがわせます。
また、このグラフを横方向にドラッグすると、その時間帯を拡大したグラフを見ることができます。
実際に運用しているサーバのグラフを毎日なんとなく眺めていれば、平常のグラフと違うところにはすぐに気がつきます。その時「おや?これはなんだろう?」と思ってそこをつつくとその答えが出てくるようなイメージで、自然な操作ができると思います。
とりあえず、このCPU使用率のページで、何か普段と違うところを見つけたら、ドラッグしてその時間帯を拡大して、それから左側のタブをクリックして、プロセス単位のリソースの使用状況などの詳細を見ていくような運用になるかと思います。
アラート
あと、インストールした時点で、基本的なアラートの設定も行われています。
アラートは、"Policy" という設定を行って、サーバにその "Policy" を割り当てる仕組みですが、デフォルトでは、下記のような "Default Server Poilicy" というポリシーが作成されていて、追加したサーバには、自動的にこれが割り当てられます。
このポリシーでは、CPU使用率が60%以上が20分間継続したら、Caution(グラフのバックグラウンドで色分け表示)となり、80%が15分継続したら、アラートメールを送信します。
最初はこのままで運用して、使いながら少しづつ調整していけばいいと思います。Alert -> Server Policies と選択すると上記のページになります。
まとめ
SERVERSには、この他にもネットワークやディスクのタブがあって、他にも色々な情報を見ることができます。ただ機能が多いというだけではなく、一般的なユースケースを想定して、そのための自然な操作となっていることがポイントだと思います。
そのユースケースとしては、「ノウハウのある専任の人が事前に計画してきちんと運用する」というよりは、「アプリケーション開発者が他に人がいなくて仕方なく運用をやり始めて、いくつかのトラブルを通してだんだん覚えていく」というようなストーリーが想定されているような気がします。走りながら、運用に関するノウハウと同時に、このプロダクトの使い方を少しづつ覚えていくという感じです。
こういうパターンにはまりそうな人は、ぜひ試してください。
あと、私が使っていて、機能不足を感じるのは、複数のサーバのメトリクスを一つのグラフとして見る機能ですね。APM の場合は、INSIGHTSというプロダクトと連動することで、そのようなニーズにも応えられるようになっていますが、SERVERSの場合は、サーバごとの個別の表示のみで、INSIGHTSとの連動機能もありません。
デジカでは、NewRelicのメトリクスをSensuに流し込んで、Garfanaで複数サーバを一覧するグラフを作成しています。この方法については、日を改めて紹介したいと思います。