Help us understand the problem. What is going on with this article?

ページ表示速度をPhantomJSで計測してZabbixに記録する

More than 3 years have passed since last update.

Webページの表示速度って大事ですよね。Googleの検索順位にも影響が出るっていうし、なによりユーザが見たいと思った時に、遅くてなかなか見られないというのは単純に機会損失になります。じゃあ表示速度を早くしようとなるわけですが、そこらへんはわりとベストプラクティスみたいなのが語られまくってますね。

ちょっと古いですが僕が昔か書いたWebフロントエンド表示速度、最速化手法まとめみたいなのとか。

で、早くする技工的なものは良いんですが、一番大事なのは計測すること。これですね。普段、どれくらいの表示速度で、揺らぎがあるのかないのか、どこかの時点で遅くなっていないかなどを把握する必要があります。

サイト表示速度の監視

サイトの表示速度を計測してくれるナイスなサービスがいくつかあります。

有名所だとpingdomとnewrelicでしょうか。かなり良さげなんです。これ使えば、まぁ解決するんですがお金がかかるんです。それがけっこうな金額で。弊社ベーシックでは、結構な数のWebサービスを運営しているため、お金もめちゃくちゃかかる…できればコストを最小限に抑えて自前で構築したい! コスト削減重要。

また、計測サーバの場所も重要です。アメリカにあるサーバから、日本国内にあるサーバのパフォーマンスを計測すると、どうしてもレイテンシがきつくて実際の値とはかけ離れてしまいます。pingdom以外はアジアリージョンは選べなかったような気がします(newrelicはJS埋め込んでの計測なので関係ないと思うけど)。

GoogleAnalyticsのサイト速度

GoogleAnalyticsにもサイトの表示速度を計測してくれる機能があります。これ使えよって思うんですが、表示速度が遅くなった時にアラートを出したり、特定のリソースファイルのパフォーマンスが悪いなどの細かい制御ができないため、独自でやってみることにしました。便利で良いんですけどね。

というわけで、PhantomJS + Zabbixを使って自前で構築してみたよーというのが、この記事の趣旨です。

ZabbixでWeb監視

まず、監視と言ったらZabbixですね。というわけで、Zabbixにも「Web監視」という機能があります。これは、指定URLにたいしてGET/POSTしつつレスポンスタイムを計測してくれるという、パフォーマンス計測+サイトステータスチェックとしても使える良い感じのやつです。

zabbix.png

複数のURLを指定でき、かつPOSTデータやCookieなどある程度細かくリクエストの制御ができます。

ただ、レスポンスタイムはあくまでHTMLのドキュメントが返ってくる時間なので、実際にユーザがブラウザで閲覧するときのレスポンスとは違います。できれば、画像やCSSなどを含んだレスポンスタイムが欲しいです。

PhantomJSでパフォーマンス計測

そこでPhantomJSを使います。JavaScriptのテストだったり、スクレイピングだったりで大活躍なツールですね。これを使って表示パフォーマンスを計測します。

phantomjs_image.png

こんな感じのイメージです。PhantomJSが動く計測サーバを作ります。そして、PhantomJSで監視対象サイトをクロールして、取得したパフォーマンスデータをZabbixサーバに送ってあげる感じです。

PhantomJSのインストール

PhantomJS v2.0のLinux用バイナリが提供されていないので、 v1.9.x系を利用します。ビルド時間かかるし。 と思ったんだけど、v1.9.x系だとちょっと不具合があったのでv2.0を利用することにしました。

v1.9.xのバイナリインストール方法

一応、残しておく。

$ cd /tmp
$ wget https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-1.9.8-linux-x86_64.tar.bz2
$ tar jxf phantomjs-1.9.8-linux-x86_64.tar.bz2
$ sudo mv phantomjs-1.9.8-linux-x86_64/bin/phantomjs /usr/local/bin/
$ phantomjs -v
1.9.8

v2.0のインストール方法

Linux用のバイナリイメージは公式ではまだ配布されておらず、ソースからのビルドが推奨されています。ビルドするのに30分位かかります、まじで。ラーメンでも食べに行きましょう。

$ sudo yum -y install gcc gcc-c++ make flex bison gperf ruby openssl-devel freetype-devel fontconfig-devel libicu-devel sqlite-devel libpng-devel libjpeg-devel

$ wget https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-2.0.0-source.zip
$ unzip phantomjs-2.0.0-source.zip
$ cd phantomjs-2.0.0-source
$ ./build.sh

パスを適当に通しておきます。

$ sudo ln -s /home/ec2-user/phantomjs-2.0.0/bin/phantomjs /usr/local/bin/phantomjs

node.jsのインストール

nodebrewを使ってnode.jsをインストールします。

$ curl -L git.io/nodebrew | perl - setup
~/.bashrc
export PATH=$HOME/.nodebrew/current/bin:$PATH

最新バージョンのnode.jsをインストールします。それなりに時間がかかります。

$ nodebrew install latest

もし、gcc++が入っていない場合はyumなどでインストールします。

$ sudo yum install -y gcc-c++
$ nodebrew list
v5.1.0

current: none
$ nodebrew use v5.1.0
use v5.1.0

$ node -v
v5.1.0

もうv5.1.0なんですね。

HARファイルを作成する

PhantomJSには便利なサンプルスクリプトが用意されていて、HARファイル(サイトのリクエスト情報をJSON形式で保存する)を作成するスクリプトがあります。このnetsniff.jsを使えば指定したページを閲覧するときのリクエスト情報が手に入ります。

使い方は簡単。

$ phantomjs netsniff.js http://www.example.com/

これだけです。

出力されたJSONの中のlog -> pages[0] -> pageTimings -> onLoadの値がページリクエスト完了までのミリ秒になります。

{
    "log": {
        "version": "1.2",
        "creator": {
            "name": "PhantomJS",
            "version": "2.0.0"
        },
        "pages": [
            {
                "startedDateTime": "2015-11-30T08:33:36.602Z",
                "id": "http://www.example.com/",
                "title": "サンプルページ",
                "pageTimings": {
                    "onLoad": 1564 // ←これ
                }
            }
        ],
        "entries": [

こいつを収集してZabbixでグラフ化すればOKというわけです。

ちなみに、公開されているnetsniff.jsは画像系のファイルはスキップするようになっているので、削除して利用しています。

(おまけ)HARファイルの中身を解析する

HARファイルの中身をオンラインで解析して表示したい場合は、以下のサイトを利用すると良いです。Chromeのデベロッパーツールのネットワーク表示のように出せます。

har_preview.png

HARを返すAPIサーバを立ち上げる

いきなりここからファ?!となる面倒臭さなんですが、Zabbixでグラフ化するには定期的にPhantomJS + netsniff.jsを叩かなくてはならないです。ZabbixサーバにPhantomJSインストールしても良いんですが、Zabbix以外にも使うかもしれない…というわけで、別途APIサーバをたてます。

ボロいスクリプトですがnode.jsで動くAPIを作りました。よければ使ってください。

nakaguri→中ぐりです。ボール盤などでぐりぐり穴を開けるように、サイトの表示リクエストをグリグリ開ける感じのイメージです。ネーミングセンスないですね。ごめんなさい。

使い方は、普通にcloneもしくはダウンロードして、npm installでライブラリいれて、サーバ起動するだけです。適宜、foreverやpm2などでデーモン化してnginxかませばAPIサーバの出来上がりです。

$ git clone git@github.com:zaru/nakaguri.git
$ cd nakaguri
$ npm install
$ node app.js
http://example.com:3000/?url=計測URL

このように叩くと、計測URLのHARデータを返却します。

Zabbixに記録する

nakaguriで計測APIサーバができたので、次はZabbixの設定です。計測したいサービスは複数あり、かつ計測したいURLも複数あるのが普通というか人情なので、ここはローレベルディスカバリという機能を使って自動的にアイテムとグラフの追加をするようにします。

ディスカバリに追加

「設定」→「テンプレート」で適当なテンプレートを選択して、「ディスカバリルール」を選び新規追加します。

zabbix-1.png

項目
名前 適当に
タイプ 外部チェック
キー discover_site_speed[{$SITE_SPEED_URL}]

キーのdiscover_site_speedはスクリプト名になるので、適宜変更してください。

/usr/lib/zabbix/externalscripts/discover_site_speed
#!/usr/local/rbenv/shims/ruby

require 'json'


exit if ARGV[0].nil?

sites = {'data' => []}
ARGV[0].split(',').each do |url|
  sites['data'] << {'{#SITE_SPEED_URL}' => url}
end

puts sites.to_json

出力結果の例はこんな感じです。

{
  "data":[
    {
      "{#SITE_SPEED_URL}":"http://www.example.com/"
    },
    {
      "{#SITE_SPEED_URL}":"http://www.example.com/page_a"
    }
  ]
}

アイテムのプロトタイプ追加

アイテムのプロトタイプを追加します。

zabbix-2.png

項目
名前 適当に
タイプ 外部チェック
キー site-speed[{#SITE_SPEED_URL}]
単位 msec
更新間隔 60

スマートフォン用のサイト計測をしたい場合はキーを以下のように変更します。

項目
キー site-speed[{#SITE_SPEED_URL}, SP]

計測スクリプトの作成

キー名のsite-speedというのが計測スクリプトになります。先ほどたてた計測APIサーバのドメインに適宜変更をしてください。

/usr/lib/zabbix/externalscripts/site-speed
#!/usr/local/rbenv/shims/ruby

require 'open-uri'
require 'json'

url = ARGV[0]
ua = (ARGV[1] == 'sp') ? '&ua=sp' : ''
json = open('http://example.com:3000/?url=' + url + ua).read
result = JSON.parse(json)
puts result['log']['pages'][0]['pageTimings']['onLoad']

グラフのプロトタイプ追加

グラフのプロトタイプを追加します。

zabbix-3.png

PC用とSP用を両方アイテムプロトタイプ作っている場合は、2つ追加してあげます。グラフの表示は好みなんでしょうが、ベーシックに折れ線グラフにします。以上で、ローレベルディスカバリの設定は完了です。

ホストのマクロ設定

次に、適用したいホスト設定を選択し、マクロに監視したいURLを定義します。カンマ区切りで複数のURLを定義できます。

zabbix-4.png

マクロ
{$SITE_SPEED_URL} http://example.com/,http://example.com/hoge

以上で、Zabbixの設定は完了です。しばらくたつとグラフが描画されていると思います。

zabbix-5.png

良い感じですね!

ZabbixテンプレートXML

Zabbixの設定が面倒な人は、テンプレートXMLを作ったのでこれをインポートすればそれっぽく計測できると思います。

PhantomJSでのページ取得はそれなりにリソースを食うので、大量にページを計測する場合にはスペックをそれなりに上げるか、スケーラブルなAPIサーバ構成にする必要があります。

まとめ

今回の例だと単純にページの表示速度だけを計測していますが、読み込んでいる画像やJSの数、極端に遅いリソースを見つけ出してSlackにアラートを出すなど色々できます。ファイルサイズなども表示速度には大きく影響をあたえるので、それを炙りだすのもいいかもしれません。

これでいつどこでページの表示速度に変化があったのかが気づけて、改善のしがいが出てきますね!

明日はUdaちゃんです。SEOについて書くらしいので期待大です。

zaru
basicinc
マーケティングとテクノロジーで社会のあらゆる問題を解決する集団
https://tech.basicinc.jp/
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away