LoginSignup
1
0

More than 1 year has passed since last update.

ビジネス・オブザーバビリティ?Elasticでビジネストレンドのレポート自動化に挑戦

Last updated at Posted at 2022-12-15

はじめに。BIツールで作るレポートの課題。

何かのビジネスのトランザクションのデータに対して分析を行う時、長期的なトレンドを見ながら様々な面に切り分けて観測したいと思います。

BIツールや今回使うKibanaなどを触りながら分析をして、洞察を得ることができるかもしれません。しかし、これはそのツールを使いなれていないと厳しいです。物事を判断する上の人たちがそういったツールを操作することはないですよね。
結局は、BIで作ったデータをパワーポイントなどに貼り付けて報告しているケースが多いんじゃないかと。
しかし、分析する面が増えるほどpptに貼り付けるグラフを作成しなければいけないので、結構大変です。

また、作成したレポートにツッコミを受けるケースがよくあります。

  • これってどういう条件で作ったグラフ?
  • この数値何かおかしくない?本当?
    そんな時にすぐに集計元のデータを見せながら説明できないと、自分が作った分析で他人を納得させて、アクションを取ってもらうのは大変です。

ElasticsearchとKibanaで課題に挑戦

今回はKibanaを使って、以下を実現してみたいと思います。

  • 1ヶ月単位の統計値を過去12ヶ月のデータとともに表示する
  • 色々な観点でスライス&ダイスしたレポートを作る。そして誰でもその結果を簡単に確認できるように、それぞれをPDFとして出力する
  • 必要に応じてすぐに集計元データを確認ができるようにする

統計レポートはこんな感じのイメージです。派手な図は必要ありません。。線グラフとその数値がパッと分かれば良いです。
あとはこのレポートを分析したい観点別に提供して欲しいです。
image.png

使用する分析データ

Kibanaに付属しているサンプルのFlightデータセットを使います。
image.png

出来上がったもの

Webダッシュボード

このように、時系列のグラフと、表で月ごとの統計値を確認できるようにしています。分析する面は国にしました。DestCountry: JP(日本)でフィルタをかけています。
(今回データの準備の都合上、月別ではなく、3日間ごとのデータに分けています)
image.png

ダッシュボードのPDF出力

右上のShareのメニューから、Kibanaのレポート機能でPDFとしてエクスポートできます。以下実際のPDFです。Webダッシュボードとほぼ同じ見た目で作成されます。
image.png

集計元データの確認画面

上のダッシュボードを見てより詳しくフライト番号などを確認したいとなった場合は、生のフライトデータをKibanaのDiscover機能で確認できます。この画面も、国別のSaved Searchとして保存しておきます。
image.png

国ごとにダッシュボードと、集計元データ画面を作成

APIを使ってフィルタする国の文字列だけ変更してコピーをどんどん作成しました。作成にあたってAPIを使いました。
image.png

サイトマップ的な各画面へのリンク集

Kibanaを使い慣れていない人でも目的の画面を開けるように、リンク集をダッシュボード上に作りました。
image.png

PDFのメール自動送信

ElasticsearchのWatcher機能を使ってダッシュボードをPDFとしてメール送信できます。
image.png

どう実装したか

ピボットテーブル

時系列を横軸にした表グラフを作るところをどうするかですが、Kibana LensのTableを使った形式が時系列の集計のピボットテーブルを作成するのに有効でした。Split metrics byで任意の時間感覚に統計を分けていくことができます。
image.png

データ別のレポートの作成を自動化

今回の場合、数十個の国分のレポートを手で作るのは大変です。一つ一つGUI上でフィルタしている国を変えて、保存していくこともできますが、これだと手間ですし、運用する上でスケールしません。

KibanaにはダッシュボードやSaved SearchをインポートエクスポートするAPIがあります。
(こちら2022/12/15時点でプレビュー版であり、将来変更になる可能性があることと、正式サポートレベルがこれに関して適用されないことは了承の上、使ってください。)
https://www.elastic.co/guide/en/kibana/8.6/saved-objects-api-export.html

これを活用して、国のところだけを変えたコピーを作っていきます。

今回のコードのサンプルは、pythonのpytestのテストコードとして書いていますが、HTTPを実行できるスクリプトであれば何でも代用可能です。

ダッシュボードをエクスポートするAPIの使用例

import json
import requests
import pytest

def test_export_dashboard():
    kbn_headers = {
        'kbn-xsrf': 'true'
    }
    # ダッシュボードのIDはサンプルです。Kibanaで画面表示した時のURL(以下例)から確認できます。
    # https://<kibana_endpoint>/app/dashboards#/view/05dded0e-7b43-49d6-85a6-7389e3c11108?_g=(filters:!(),refreshInterval:(pause:!t,value:0),time:(from:now-30d%2Fd,to:now))

    source_dashboard_id = "05dded0e-7b43-49d6-85a6-7389e3c11108"
    data = json.dumps(
        {
            "objects": [
                {
                "type": "dashboard",
                "id": f"{source_dashboard_id}"
                }
            ]
        }
    )
    session = requests.Session()
    session.auth = ('<user>', '<password>')
    r = session.post(f'https://<kibana_endpoint>/api/saved_objects/_export', data=data, headers=kbn_headers)

    open(f'Flight by Country [JP].ndjson', 'w').write(r.text)
    assert r.status_code == 200

エクスポートしたダッシュボードはndjson形式のファイルです。国相当分ファイルをコピーし、Filterのquery部分に該当する文字列"JP"を別のフィルターしたい文字列に置換します。

import json
import pytest

def test_clone_dashboasrds():
    countries = ['IT','US','CN','CA','JP','RU','CH','GB','AU','PL','AT','IN','AR','ZA','DE','SE','EC','KR','NO','PR','MX','CO','PE','FI','DK','CL','AE','IE','FR','ES','TR','NL']
    with open('Flight by Country [JP].ndjson', 'r') as f:
        contents = f.read()

    for country in countries:
        new_contents = contents.replace('JP', country)
        open(f'Flight by Country [{country}].ndjson', 'w').write(new_contents)

作成した国別のダッシュボードndjsonファイルをインポートします。

import json
import requests
import pytest

def test_import_dashboard():
    kbn_headers = {
        'kbn-xsrf': 'true'
    }
    countries = ['IT','US','CN','CA','JP','RU','CH','GB','AU','PL','AT','IN','AR','ZA','DE','SE','EC','KR','NO','PR','MX','CO','PE','FI','DK','CL','AE','IE','FR','ES','TR','NL']
    for country in countries:
        files = {'file': open(f'Flight by Country [{country}].ndjson', 'r')}

        session = requests.Session()
        session.auth = ('<user>', '<password>')
        r = session.post(f'https://<kibana_endpoint>/api/saved_objects/_import?createNewCopies=true', files=files, headers=kbn_headers)
        assert r.status_code == 200

Saved SearchのExport/Importも同じやりかたです。エクスポートしたファイルのコピーも、フィルタリングしている文字列だけすり替えてインポートです。

import json
import pytest

def test_clone_savedsearch():
    countries = ['IT','US','CN','CA','JP','RU','CH','GB','AU','PL','AT','IN','AR','ZA','DE','SE','EC','KR','NO','PR','MX','CO','PE','FI','DK','CL','AE','IE','FR','ES','TR','NL']
    with open('Saved Search - Flight by Country [JP].ndjson', 'r') as f:
        contents = f.read()

    for country in countries:
        new_contents = contents.replace('JP', country)
        open(f'Saved Search - Flight by Country [{country}].ndjson', 'w').write(new_contents)

こちらはサイトマップみたいなダッシュボードを作るコードです。
ダッシュボードに一つMarkdownのテキストのビジュアルを入れておき、エクスポートしてください。
それに対して、Dashboardそれぞれの静的webリンクを生成して、markdownに追加しています。

import json
import requests
import pytest

kbn_headers = {
    'kbn-xsrf': 'true'
}

def test_create_custom_index_page_of_objects():
    session = requests.Session()
    session.auth = ('<user>', '<password>')
    r = session.get(f'https://<kibana_endpoint>/api/saved_objects/_find?type=search&search_fields=title&search="Saved Search - Flight by Country"*', headers=kbn_headers)
    assert r.status_code == 200

    markdown_lines = []
    markdown_lines.append('# データへのリンク\\\\n---')
    for object in json.loads(r.text)['saved_objects']:
        markdown_lines.append('[%s](https://<kibana_endpoint>/app/discover#/view/%s)' % (object['attributes']['title'], object['id']))

    with open('linkpage_blank.ndjson', 'r') as f:
        contents = f.read()

    markdown = '\\\\n\\\\n'.join(markdown_lines)
    contents = contents.replace('FILL', markdown, )
    with open('linkpage.ndjson', 'w') as f:
        f.write(contents)

def test_import_custom_index_page_of_objects():
    session = requests.Session()
    session.auth = ('<user>', '<password>')
    files = {'file': open('linkpage.ndjson', 'r')}
    r = session.post(f'https://<kibana_endpoint>/api/saved_objects/_import?overwrite=true', files=files, headers=kbn_headers)
    assert r.status_code == 200

WatcherでPDFを自動メール送信するところです。
こちらのドキュメントを参考にしています。
https://www.elastic.co/guide/en/kibana/8.6/automating-report-generation.html

また、前提として、API経由でPDFレポートを作成するためには、別途以下の設定が必要です。こちらを事前に実施しておきます。
https://www.elastic.co/guide/en/kibana/8.6/secure-reporting.html

import json
import requests
import time
import pprint
import pytest

kbn_headers = {
    'kbn-xsrf': 'true'
}

def test_watcher_pdf_report():
    session = requests.Session()
    session.auth = ('<user>', '<password>')
    countries = ['IT','US','CN','CA','JP','RU','CH','GB','AU','PL','AT','IN','AR','ZA','DE','SE','EC','KR','NO','PR','MX','CO','PE','FI','DK','CL','AE','IE','FR','ES','TR','NL']

    
    # 以下は上でインポートして作成したサイトマップのダッシュボードへのリンクです。適宜置き換えてください。
    sitemap_dashboard_url = 'https://<kibana_endpoint>/app/dashboards#/view/f7975e64-a44c-450c-8e79-052b735bf6c1'

    for country in countries:
        r = session.get(f'https://<kibana_endpoint>/api/saved_objects/_find?type=dashboard&search_fields=title&search="Flight Trends by City [{country}]"', headers=kbn_headers)
        assert r.status_code == 200

        # PDFにしたいダッシュボードのIDを取得しています。下の"url"の中で使用します。
        id = json.loads(r.text)['saved_objects'][0]['id']

        data = json.dumps(
            {
            "trigger" : {
                "schedule": {
                "interval": "1d"
                }
            },
            "actions" : {
                "email_admin" : { 
                "email": {
                    "to": "'Recipient Name <recipient@example.com>'",
                    "subject": f"フライト日次レポート[{country}]",
                    "body" : f"国[{country}]到着便の集計レポートについて添付ファイルをご確認ください。\n また、詳細なフライトデータに関してはこちらをご確認ください。\n {sitemap_dashboard_url} ",
                    "attachments" : {
                    f"flight_report_{country}.pdf" : {
                        "reporting" : {
                        "url": f"https://<kibana_endpoint>api/reporting/generate/printablePdfV2?jobParams=%28browserTimezone%3AAsia%2FTokyo%2Clayout%3A%28dimensions%3A%28height%3A1071.99658203125%2Cwidth%3A2844.444580078125%29%2Cid%3Apreserve_layout%29%2ClocatorParams%3A%21%28%28id%3ADASHBOARD_APP_LOCATOR%2Cparams%3A%28dashboardId%3A%27{id}%27%2CpreserveSavedFilters%3A%21t%2CtimeRange%3A%28from%3Anow-30d%2Fd%2Cto%3Anow%29%2CuseHash%3A%21f%2CviewMode%3Aview%29%29%29%2CobjectType%3Adashboard%2Ctitle%3A%27Flight%20Trends%20by%20City%20%5BJP%5D%27%2Cversion%3A%278.5.0%27%29", 
                        "retries":40, 
                        "interval":"15s", 
                        "auth":{ 
                            "basic":{
                            "username":"<user>",
                            "password":"<password>"
                            }
                        }
                        }
                    }
                    }
                }
                }
            }
            }
        )

        r = session.put(f'{PROTOCOL}://{ES_HOST}:{ES_PORT}/_watcher/watch/flight_report_{country}', data=data, headers=headers)
        pprint.pprint(r.json())
        assert r.status_code == 201 or 200, r.json()['error']['reason']

まとめ

最後ちょっとスクリプトが必要ですが、KibanaのAPIやPDF出力があるお陰で、たくさんのKibanaレポートを自動作成して、それを配布する運用が実現できると思います。
なお、WatcherとPDF出力の利用はオンプレダウンロード版の場合、プラチナの有償ライセンスが必要となります!

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0