はじめに
チーム内で開発環境の様々なメトリクスを監視/可視化する取り組みをしています。
今回は隔離された環境に対する監視、可視化、通知の仕組みを作ろうとしていて、それ自体が結構大変で、別途記事を書こうと思いますが、今回はデータの格納と可視化部分にのみフォーカスして書きます。
どうでもいいですが最近チーム内に何か広めるときは先にqiitaに書いてから紹介するという手法を取っています。この記事もチーム内のMetabase使いたいけどよくわからんひとに向けて書いています。
metabase
以下の記事で知って、さっそく使ってみたクチです。
OSSのデータ可視化ツール「Metabase」が超使いやすい
BIのための、データを可視化するツールです。
可視化に特化しているため、データベースは別途用意する必要がありますが、逆にデータベースにデータさえため込んでおけば、metabase側から好きな形で可視化することができます。
対応データソースは以下の通り。使い慣れたデータベースを使うことができるのでうれしいですね。
- BigQuery
- Crate
- Druid
- Google Analytics
- H2
- MongoDB
- MySQL
- PostgreSQL
- Presto
- Amazon Redshift
- SQlite
- SQL Server
(公式より)
で、今回は使い慣れたデータベースということでMariaDBを用いました。
構築方法
docker-composeで立ち上げました。docker/docker-composeのインストール方法はどこか別の記事を参照してください。
version: '2'
services:
web:
image: metabase/metabase
ports:
- "3000:3000"
links:
- db:db
depends_on:
- db
restart: always
db:
image: mariadb:10.2.12
ports:
- "3306:3306"
volumes:
- ./data/volumes:/var/lib/mysql
environment:
- MYSQL_ROOT_PASSWORD=root
restart: always
MariaDBのデータは永続化しています。ファイルパスやポートはよしなに書き換えてください。
Metabaseのデータベース(H2)は永続化していないのでそのうちします。。。
MariaDBのrootパスワードは(よくないですが)environmentに持たせています。
# docker-compose up -d
接続方法
MetabaseからMariaDBへの接続です。
新規接続時、ユーザ登録後にデータベースの接続設定を入力することができます。すでにデータを格納しているデータベースがある場合接続しましょう。このようにBIツールとデータベースが完全に分離しているのでいいですね。後からでももちろん追加できます。
データを匿名で送信するか?ってやつですね。断っておきました。
さて、MetabaseではQuetionという単位でデータを扱います。上部のNew Questionをクリックし、Customを選択しましょう。
ここでは接続するテーブルを選択し、フィルタが必要ならフィルタすることで、データを見ることができます。まず通常通り、テーブルで表示しています。うんうん入ってるねーと見てください。
Tableの部分を変えることで様々なデータの見方ができます。今回Lineを選択し、横軸をCreated_atにすることで、時系列の、あるストレージの使用状況がグラフにできました!楽ちんだ~!
このQuestionはSaveしておくとあとからいつでも編集することができます。また、ここでDashboardに追加する?と聞かれるのでYesを選ぶとダッシュボードに追加されます。自分好みのダッシュボードが作れる点もアツいですね。
データ格納方法
データベースへのデータ格納方法はMetabaseと分離し、各データベースの方法に従うのですが、一応載せておきます。
まず、何らかの方法でストレージの空き容量をcsvファイルで取得します。
Name,Size[GiB],Available[GiB],Used[percent]
storage01,3516,3430,2
storage02,87013,20098,77
storage03,38152,6941,82
storage04,57228,17279,70
これは同時にチャット(mattermost)に通知もしています。
取得後、これをデータベースに格納します。
Python3.6で動作確認、pip install mysqlclientが必要。その依存でmysql_configコマンドが必要ですので、yumでmariadb-develをinstall。他、gccやpythonX.X-develも必要でした。コードのスタイルチェックにはpycodestyleを使いました。
# coding:utf-8
import csv
import MySQLdb
import os
con = MySQLdb.connect(db="storage", user="root", passwd="root", host="127.0.0.1")
cur = con.cursor()
current_dir = os.path.dirname(os.path.abspath(__file__))
path2 = os.path.join(current_dir, "css", "style.css")
for area in ['area1', 'area2']:
filename = area + ".csv"
path = os.path.join(current_dir, filename)
f = open(path, "r")
reader = csv.reader(f)
header = next(reader)
for row in reader:
sql = f"INSERT IGNORE INTO storage_{area}(name, size, available, used)" \
+ "values(%s,%s,%s,%s)"
cur.execute(sql, (row[0], int(row[1]), int(row[2]), int(row[3])))
f.close()
con.commit()
cur.close()
con.close()
storageというDATABASEの、storage_area1/2 TABLEに、csvをそのまま突っ込んでいます。
csvを読み込んでinsertする部分を参考にしてください。フォーマット文字列リテラルを使いたかったのでPython3.6にしました。
MariaDB側では、時系列データがほしいので、テーブル作成時にcreated_atを作成しています。
MariaDB [storage]> show create table storage_area1;
+-------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Table | Create Table |
+-------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| storage_area1 | CREATE TABLE `storage_area1` (
`name` varchar(20) DEFAULT NULL,
`size` int(11) DEFAULT NULL,
`available` int(11) DEFAULT NULL,
`used` int(11) DEFAULT NULL,
`created_at` datetime DEFAULT current_timestamp()
) ENGINE=InnoDB DEFAULT CHARSET=latin1 |
+-------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.00 sec)
1日1回、データ取得、チャット通知、DB格納をバッチ的に実行しています。
おわりに
あんまり変化がなくておもしろくないですね。
変化をたのしめるメトリクスをつっこんでくれるメンバーを募集中です。
installするだけでagent経由で勝手に取得してくれる便利な統合監視ソフトウェアはたくさんありますが、このように個別で手作りするのもいい勉強になりました。もっと楽にデータ格納できる方法もあるかもしれませんが、使い慣れた方法の組み合わせでできたので、特に苦労なく実現できました。
まだまだMetabase使いこなせてないので、データを増やして使いまくります。
以上です。