LoginSignup
0

More than 1 year has passed since last update.

posted at

updated at

Organization

Alibaba CloudのKibanaで新型コロナウィルス感染状況を可視化しよう!

前回の続き

前回2020/12/16の投稿の続きとなります。前回はElasticSearchのクラスターを構築してKinabaも同時に立ち上げるところまで実施しました。今回はKinabaのUIを操作して新型コロナウィルス感染状況の各種OpenDataを使って可視化したいと思います。

データの用意

新型コロナウィルス感染状況について厚生労働省がcsvファイルでオープンデータを公開してくれています。これを使ってみたいと思います。
厚生労働省オープンデータのサイト

いくつかのデータをマージして1つのCSVにして今回は利用しました。
陽性者数、PCR検査実施人数、入院治療等を要する者の数、退院又は療養解除となった者の数、死亡者数のデータをマージしました。
スクリーンショット 2020-12-17 23.53.57.png

ここでKibanaというかElasticSearchのデータ形式の制限なのか、2020/01/16みたいなYYYY/MM/DD 形式だとDate形式で読み込んでもらえず、YYYY-MM-DDの形式にすることで変換がスムーズに行きました。

データの読み込み

KibanaのUIからデータを読み込むことでElasticSearchのDBにデータを読み込ませることができます。今回導入したのはV7.7.1の画面になりますが様々な形式のデータを読み込めるメニューが用意されています。CSVデータは"Upload data from log file"のメニューから読み込みます。

スクリーンショット 2020-12-17 10.31.41.png
CSVファイルをドラックアンドドロップするだけです。
スクリーンショット 2020-12-17 10.31.58.png

データのImport

Importを開始する際に、データ形式をチェックする"Override settings"メニューから"Should trim fields"の項目をチェックしてください。各種データがnumber形式で読み込まれます。これをチェックしていないとKeyword形式で読み込まれてしまい、数字として扱われなくなってしまいます。
スクリーンショット 2020-12-18 0.03.50.png
"Override settings"メニューを開いてください。
スクリーンショット 2020-12-18 0.04.00.png
"Should trim fields"の項目をチェックしてください。
スクリーンショット 2020-12-18 0.04.12.png

これでImportしてみます。
スクリーンショット 2020-12-17 10.39.46.png
Import後にビジュアライゼーションのメニュー"Open in Data Visualizer"がすぐ選べるようになっています。
スクリーンショット 2020-12-17 10.39.58.png

新機能のLensを使ってみる

Visualizerでもグラフ等を作成できるのですが、新機能でベータ提供されているLensを利用してみました。これもドラック&ドロップでグラフが作成できる優れものです。
"Dashboard"メニューを選んで"Create new"を選択します。そうすると様々なグラフパターンとLensのトライアルも表示されます。
スクリーンショット 2020-12-17 23.17.08.png
"Go to Lens"を選んでください。
スクリーンショット 2020-12-17 23.17.18.png
左側のデータ項目を右側のX-axisやY-axisにドラップ&ドロップするだけでグラフが自在に作れます。
スクリーンショット 2020-12-17 23.17.28.png
時系列のヒストグラムにする場合はX-axisに@timestampを入れます。その他のデータも自由に選択します。
スクリーンショット 2020-12-17 23.16.43.png
作ったヒストグラムをSaveするとDashboardに反映されます。2種類のヒストグラムを作ってDashboardに反映してみました。簡単ですね!
スクリーンショット 2020-12-17 23.42.54.png

作ったグラフをURLリンクで共有することができます。サイトなどに埋め込めばデータ分析サイトみたいなものが作れますね!
スクリーンショット 2020-12-18 0.20.57.png

機械学習機能"Machine Learning"が!

"Machine Learning"というメニューがありとても気になっていますが、今回は詳細に試せませんでした。でも、CSVファイルを読み込んでサマリを分析されたメニューが"Machine Learning"の"Data Visualizer
"でした。その他に"Anomaly Detection"や”Data Frame Analytics”もありますのでこれを今後試さなければですね。
スクリーンショット 2020-12-18 0.26.36.png
このメニューからCSVファイルを読み込むことでも、同じ読み込みができます。
スクリーンショット 2020-12-18 0.26.45.png

その他にAlibaba Cloudで作るKibana/ElasticSearchで便利なこと

Alibaba Cloudで自動構築されたElasticSearchには様々な必要なPlug-inも同時にインストールしてくれていました。特に日本語化Plug-inのKuromojiが最初からインストールされているのが嬉しいですね。
スクリーンショット 2020-12-17 22.49.06.png
またAlibaba CloudならではのPlug-inも多数用意されています。特に今回の環境には入れていませんでしたがaliyun-knnというものは画像認識のPlug-inでAlibaba CloudのAI研究所「DAMOアカデミー」が開発したものです。これもまた試してみたいですね!
スクリーンショット 2020-12-17 22.48.45.png

まとめ

・KibanaのUIからElasticSearchにデータを読み込ませ、ビジュアライゼーションまで一気にできます。
・Lensという強力なビジュアライゼーション作成ツールも導入され、どんどん進化していってます。
・データの準備などでは読み込ませるデータ形式に注意しましょう。(本来はKibanaの"Index patterns"メニューなどで定義を行って読み込ませるとスムーズのようです。)
・機械学習機能"Machine Learning"はさらに活用可能性を秘めています。
・Alibaba Cloud独自の環境設定で日本語化環境Plug-inなど事前に導入されていて便利になってます。
・aliyu-xxシリーズのAlibaba Cloud独自Plug-inも画像検索Plug-inなどあり試す価値ありです。

ElasticSearch、Kibanaは本当に便利なツールで、奥も深いツールですね。これからも勉強していきたいと思います。

参考にしたサイト
https://www.elastic.co/jp/
東洋経済Onlineサイト

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
What you can do with signing up
0