LoginSignup
6
5

More than 5 years have passed since last update.

TableauServerで任意条件で変わる分析サイトを作ってみる

Posted at

はじめに

Tableauを使うと簡単にダッシュボードが作れるので、
その可視化力を活かして、簡易な分析サイトが作れないか試してみます。

今回は、Tableau Serverで任意の抽出条件を指定し、Amazon Redshfitから
データを取得して画面表示を行います。

※ セキュリティ等は考慮しません。

作成の流れ

Tableau Desktopで作ったワークブックをサーバーにパブリッシュする流れで作成します。
また、Tableau Desktop(ローカル環境)から直接本番DBに接続出来ない想定で作成します。

(今回は下記の流れ)

  • 一旦、TEXTファイル(sample.txt)のデータを用意する
    ※ ダッシュボード作成時は抽出データを使った方が早いので楽
    ※ TEXTファイルのヘッダーはテーブルのカラム名と合わせておく
    ※ 直接本番DBに接続出来るなら、この時点でカスタムSQLを作成して数件抽出した方が楽かも

  • 上記TEXTを使用しTableau Desktopで画面イメージを作成する

  • カスタムSQLを作成

  • ワークブックのパブリッシュ

  • 動作確認

<注意>
但し、カスタムSQLを作成する時点ではDBに接続する必要がありますので、
ローカル環境から接続可能な仮DB(DB名は本番DBと同じ名称)を用意する必要があります。
(データの中身はなくても良いけど、DB、テーブルの準備が必要です)

サンプルデータ

次の10,000件のデータがDB上に存在するものとする

Table名:book

id author title
1 太宰治 人間失格
2 太宰治 走れメロス
3 太宰治 斜陽
4 ○○○○ ××××
5 ○○○○ ××××
・・・ ・・・ ・・・
9998 宮沢賢治 銀河鉄道の夜
9999 宮沢賢治 セロ弾きのゴーシュ
10000 宮沢賢治 注文の多い料理店

TableauDesktopでワークシートを作成する

まず、TEXTファイルを読み込んでワークシートを作成する。
ここでは、データ表示を行う「表」と共にSQLの「条件」となるパラメーターを作成する。
1.png

ダッシュボードに配置する

ダッシュボードに先ほど作ったワークシートを配置し、条件入力欄となるパラメーター(作者)を表示する。
2.png

カスタムSQLの作成

<新規接続の追加>
3_.png

今回は仮DBとしてPostgreSQL(Amazon RedshiftはPostgreSQLに基づいているため)の環境を用意する。
但し、厳密には相違点があるため注意が必要。
接続は作れてもカスタムクエリ作成時の結果プレビューはエラーが出る可能性あり。
Amazon Redshift および PostgreSQL

<カスタムSQLの作成>
4.png

  • 接続は動的に内容を変えるため、「ライブ」接続にしておく 10.png

ワークブックのパブリッシュ

Tableau Serverにワークブックをパブリッシュします。
5.png
今回は仮DBに接続していたので、パブリッシュ後にTableauServer上で本番DBに接続先を変更する。
6.png
(注意)上述した通り、このタイミングで接続DB名は変更出来ないので注意

動作確認

検索条件を変えて、データが絞り込まれるか確認してみる。
7.png
AWS管理画面からSQLを見ると下記のようなクエリが流れているのが確認出来ます。
無事、条件(作者名)変更したデータを都度取得しています。
8.png
TableauからRedshiftに投げるクエリはカーソルが利用されるようです。
Redshiftのカーソルクエリはキャッシュに乗るようなので、同クエリであれば
2回目以降の表示は早くなりそうですね。

実際に流れているクエリを確認するには下記の投稿が参考になります。
TableauでRedshiftに実行されたクエリを確認する

おわりに

確かに可視化という部分では手軽に作ることが出来ましたが、
入力したパラメーターに応じてSQLの条件を変えたりすることが難しい(※1)ので、
基本的に1本のSQLで抽出したデータを使った分析サイトなら出来そうです。
(※1) パラメーターを使って対象テーブルの切り替えを行う等は出来そう
もし計算フィールドがカスタムSQLに挿入出来るようになれば幅が広がりそうですね。

<下記のような動的な分析サイトが作成可能です>
9.png
<その他>
1.初回アクセス時のパラメーターに条件を入れていないときは、
DBにアクセスしてほしくないのですが、これを止める方法はないかなぁ。。

2.大規模なデータの場合、パフォーマンスに心配があります。
DBサーバーのスペックをあげたり、目的に応じたデータマートを作ったりすれば
早くなりますかね。

6
5
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
5