はじめに
zabbix3.0の新機能として魅力的な予測監視。
でも近似曲線なんて良くわからないしといつもlinearばかり使用しています。
他のfitも使ってみたいけど知識が無いと難しいので、実際にグラフを作って動作を見てみました。
理系知識が無い、文系の自分が納得できる結果が得られたられしいです。(^^)
環境
Zabbix-server:zabbix 3.0.3
agent OS:solaris10
※DISK使用率の変動が大きいのがたまたまsolarisだっただけで他意はない
ログの書き込みが常時あり、毎日AM1:00になったら切り回しと圧縮が行われ、DISK使用率が戻ります。
サーバ内には圧縮されたファイルが残るので、毎日微増している状態。
単純の予測するとピーク時に閾値を超えてしまうので近似曲線をうまく使って監視をしてみたいです。
DISK使用率の推移をグラフ化してみる
上記が監視対象サーバのDISK使用率の動きです。
まずは何も考えずに全てのfitで値を取得してみます。zabbixの設定としては、
forecast("vfs.fs.size[/,pused]",24h,0,12h,"各fitを指定",value)
でそれぞれのfitを別々のアイテムで取得します。
直近1日のデータをもとに12時間後に達するであろうDISK使用率の予測値、のはず。
そして結果です。
大きく2パターンのグラフになった。
linearとexponentialとpolynomialN(今回は1)
logarithmicとpower
結果から近似曲線を選別する
まずはそれぞれの特徴を確認
- logarithmic
対数近似は、変化率が急激に増加または減少した後でほぼ一定になるようなデータに最もよく適合する曲線
- power
累乗近似は、測定値が特定の比率で増加するようなデータに適した曲線
- exponential
指数近似は、値が増加するにつれてその増加率が大きくなるデータ、または減少するにつれてその減少率が小さくなるデータに適している
- polynomialN
多項式近似は、変動の大きなデータに適している (膨大なデータから損益の分析を行う場合など)。
- linear
線形近似は、線形性のある単純なデータ集合に最も適合した直線を作成する場合に使用する
今後の展開
- データに合わなそうな近似曲線を対象から除外
最初から予想していましたが、powerのように一定比率で増加する類ではないので調査対象から外します。
次にexponentialも対象から外します。こちらも値の増減によって比率が増していくようなタイプみたいなので、今回のデータサンプルにはあっていないと思われます。
以上の2つのfitを対象から外す替わりに、取得条件を変えたグラフを追加します。
1つ目は、polynomialNをデータ対象期間をもう少し長くしてみる
2つ目は、polynomialNをデータ対象期間をもう少し短くしてみる
を加えてグラフの変化を見てみたいと思います。
次回情報が採取されるまでお待ちください。