1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

Prometheusのすすめ - Grafanaで監視対象のユーザ一覧が欲しい -

Last updated at Posted at 2018-07-06

調査

と思ったので、探してみると、node_exporterのtextfile.directoryっていうコレクターで独自のメトリクスを作成できるらしい。

独自メトリクス取るなら Textfile Collector

要するに以下の様な形式でテキストファイル(拡張子prom)で作成すれば、勝手に読み取ってくれるよ。ってことらしい。

node_scrape_collector_duration_seconds{collector="cpu"} 0.000278377
node_scrape_collector_duration_seconds{collector="diskstats"} 0.000326093

##どういう情報が欲しいか整理する。

情報としてはユーザ名と、最終ログインの情報が欲しい。

ってことはlastlogで取れる情報を整形すれば良さそう。
そういう訳で最終的には以下のようなフォーマットにしてみる。

userlist.prom
node_user_info{username="",latest="",fromip="",tty=""} 1

スクリプト作成

上の参考記事だとrubyやら使ってるけど、私のスキルレベルだとシェルで作るのがせいいっぱいです。。

環境 : Ubuntu 16.04

userlist.sh
#!/bin/bash
OUTPUT=/usr/local/node_exporter/textfile/userlist.prom

# Ubuntu 16.04だと作られたユーザはUID 1000から採番されるのでとりあえず1000-2999までのIDを持つものでgrep
USERLIST=`cat /etc/passwd | grep -e '[1-2][0-9][0-9][0-9]' | awk -F: '{print $1}'`



# OUTPUT 初期化
: > $OUTPUT
# 処理
for i in $USERLIST;do
    NAME=$i
    PTTY=`lastlog -u $i | grep $i | awk '{print $2}'`
    FROMIP=`lastlog -u $i | grep $i | awk '{print $3}'`
    LATEST=`lastlog -u $i | grep $i | awk '{print $9" "$5" "$6" "$7" "}'`
cat << EOF >> $OUTPUT
node_user_info{username="${NAME}",latest="${LATEST}",fromip="${FROMIP}",tty="${PTTY}"} 1
EOF
done

このスクリプトをcronで回しておけば良いんではないでしょうか。

仕込み

コレクターの有効化を忘れずに。

/etc/systemd/system/node_exporter.service
# BEGIN ANSIBLE MANAGED BLOCK
[Unit]
Description=node_exporter for Prometheus

[Service]
Restart=always
User=prometheus
ExecStart=/usr/bin/node_exporter \
    --web.listen-address=0.0.0.0:9100 \
    --collector.diskstats.ignored-devices="^(dm-|ram|loop|fd|(h|s|v|xv)d[a-z]|nvme\\d+n\\d+p)\\d+$" \
    --collector.filesystem.ignored-mount-points="^/(dev|proc|sys|run|var/lib/(docker|lxcfs|nobody_tmp_secure))($|/)" \
    --collector.filesystem.ignored-fs-types="^(autofs|binfmt_misc|cgroup|configfs|debugfs|devpts|devtmpfs|fuse.*|hugetlbfs|mqueue|overlay|proc|procfs|pstore|rpc_pipefs|securityfs|sysfs|tracefs)$" \
    --collector.netdev.ignored-devices="^(lo|docker[0-9]|veth.+)$" \
    --no-collector.conntrack \
    --collector.cpu \
    --collector.diskstats \
    --no-collector.filefd \
    --collector.filesystem \
    --collector.loadavg \
    --collector.meminfo \
    --collector.netdev \
    --collector.netstat \
    --no-collector.ntp \
    --no-collector.sockstat \
    --collector.stat \
-   --no-colletctor.textfile \
+    --collector.textfile \
    --no-collector.time \
    --collector.uname \
    --collector.vmstat \
    --no-collector.arp \
    --no-collector.bcache \
    --no-collector.bonding \
    --no-collector.buddyinfo \
    --no-collector.drbd \
    --no-collector.edac \
    --no-collector.entropy \
    --no-collector.hwmon \
    --no-collector.infiniband \
    --no-collector.interrupts \
    --no-collector.ipvs \
    --no-collector.ksmd \
    --no-collector.logind \
    --no-collector.mdadm \
    --no-collector.meminfo_numa \
    --no-collector.mountstats \
    --no-collector.nfs \
    --no-collector.nfsd \
    --no-collector.qdisc \
    --no-collector.runit \
    --no-collector.supervisord \
    --no-collector.systemd \
    --no-collector.tcpstat \
    --no-collector.timex \
    --no-collector.wifi \
    --no-collector.xfs \
    --no-collector.zfs \
+    --collector.textfile.directory=/usr/local/node_exporter/textfile/

ExecReload=/bin/kill -HUP $MAINPID
TimeoutStopSec=20s
SendSIGKILL=no

[Install]
WantedBy=multi-user.target
# END ANSIBLE MANAGED BLOCK

あとcron

*/15 * * * * /usr/local/node_exporter/userlist.sh

結果

とりあえず、自サーバからcurlでmetricsが取れるか確かめる

root# curl http://localhost:9100/metrics | grep user
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100 29320  100 29320    0     0  2003k      0 --:--:-- --:--:-- --:--:-- 2045k
node_cpu_guest_seconds_total{cpu="0",mode="user"} 0
node_cpu_seconds_total{cpu="0",mode="user"} 319.13
# HELP node_filesystem_avail_bytes Filesystem space available to non-root users in bytes.
node_textfile_mtime_seconds{file="userlist.prom"} 1.530865161e+09
# HELP node_user_info Metric read from /usr/local/node_exporter/textfile/userlist.prom
# TYPE node_user_info untyped
node_user_info{fromip="XX.XXX.XXX.210",latest="2018 Jul 6 15:11:02 ",tty="pts/2",username="XXX"} 1
node_user_info{fromip="XX.XXX.XXX.210",latest="2018 Jul 6 15:57:09 ",tty="pts/1",username="ubuntu"} 1
node_user_info{fromip="XX.XXX.XXX.210",latest="2018 Jul 6 16:37:33 ",tty="pts/3",username="XXXXX"} 1

取れてますね。よしよし。

##Grafanaでリスト化
Variables設定

Name: 任意
Lable: instance
Hide: Variable
Query: node_user_info
Regex: .*instance="(.*?)".*

variables.PNG

次にtable追加
query : node_user_info{instance='$instance'}
Instantにチェック
table.PNG

後は、好きに列非表示にしたりですればヨロシ。

##参考URL

https://github.com/prometheus/node_exporter#textfile-collector
独自メトリクス取るなら Textfile Collector



Prometheus 過去記事
Prometheusのすすめ - 初期導入 -
Prometheusのすすめ - Service Discovery -
Prometheusのすすめ - exporter導入 node-exporter(apt-get) -
Prometheusのすすめ - exporter導入 node-exporter(バイナリ) -
Prometheusのすすめ - Service Discovery - EndPointが「http://:9100/metrics」になって、自分自身になってしまう件

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?