はじめに
Tableauを使うと簡単にダッシュボードが作れるので、
その可視化力を活かして、簡易な分析サイトが作れないか試してみます。
今回は、Tableau Serverで任意の抽出条件を指定し、Amazon Redshfitから
データを取得して画面表示を行います。
※ セキュリティ等は考慮しません。
作成の流れ
Tableau Desktopで作ったワークブックをサーバーにパブリッシュする流れで作成します。
また、Tableau Desktop(ローカル環境)から直接本番DBに接続出来ない想定で作成します。
(今回は下記の流れ)
-
一旦、TEXTファイル(sample.txt)のデータを用意する
※ ダッシュボード作成時は抽出データを使った方が早いので楽
※ TEXTファイルのヘッダーはテーブルのカラム名と合わせておく
※ 直接本番DBに接続出来るなら、この時点でカスタムSQLを作成して数件抽出した方が楽かも -
上記TEXTを使用しTableau Desktopで画面イメージを作成する
-
カスタムSQLを作成
-
ワークブックのパブリッシュ
-
動作確認
<注意>
但し、カスタムSQLを作成する時点ではDBに接続する必要がありますので、
ローカル環境から接続可能な仮DB(DB名は本番DBと同じ名称)を用意する必要があります。
(データの中身はなくても良いけど、DB、テーブルの準備が必要です)
サンプルデータ
次の10,000件のデータがDB上に存在するものとする
Table名:book
id | author | title |
---|---|---|
1 | 太宰治 | 人間失格 |
2 | 太宰治 | 走れメロス |
3 | 太宰治 | 斜陽 |
4 | ○○○○ | ×××× |
5 | ○○○○ | ×××× |
・・・ | ・・・ | ・・・ |
9998 | 宮沢賢治 | 銀河鉄道の夜 |
9999 | 宮沢賢治 | セロ弾きのゴーシュ |
10000 | 宮沢賢治 | 注文の多い料理店 |
TableauDesktopでワークシートを作成する
まず、TEXTファイルを読み込んでワークシートを作成する。
ここでは、データ表示を行う「表」と共にSQLの「条件」となるパラメーターを作成する。
ダッシュボードに配置する
ダッシュボードに先ほど作ったワークシートを配置し、条件入力欄となるパラメーター(作者)を表示する。
カスタムSQLの作成
今回は仮DBとしてPostgreSQL(Amazon RedshiftはPostgreSQLに基づいているため)の環境を用意する。
但し、厳密には相違点があるため注意が必要。
接続は作れてもカスタムクエリ作成時の結果プレビューはエラーが出る可能性あり。
Amazon Redshift および PostgreSQL
ワークブックのパブリッシュ
Tableau Serverにワークブックをパブリッシュします。
今回は仮DBに接続していたので、パブリッシュ後にTableauServer上で本番DBに接続先を変更する。
(注意)上述した通り、このタイミングで接続DB名は変更出来ないので注意
動作確認
検索条件を変えて、データが絞り込まれるか確認してみる。
AWS管理画面からSQLを見ると下記のようなクエリが流れているのが確認出来ます。
無事、条件(作者名)変更したデータを都度取得しています。
TableauからRedshiftに投げるクエリはカーソルが利用されるようです。
Redshiftのカーソルクエリはキャッシュに乗るようなので、同クエリであれば
2回目以降の表示は早くなりそうですね。
実際に流れているクエリを確認するには下記の投稿が参考になります。
TableauでRedshiftに実行されたクエリを確認する
おわりに
確かに可視化という部分では手軽に作ることが出来ましたが、
入力したパラメーターに応じてSQLの条件を変えたりすることが難しい(※1)ので、
基本的に1本のSQLで抽出したデータを使った分析サイトなら出来そうです。
(※1) パラメーターを使って対象テーブルの切り替えを行う等は出来そう
もし計算フィールドがカスタムSQLに挿入出来るようになれば幅が広がりそうですね。
<下記のような動的な分析サイトが作成可能です>
<その他>
1.初回アクセス時のパラメーターに条件を入れていないときは、
DBにアクセスしてほしくないのですが、これを止める方法はないかなぁ。。
2.大規模なデータの場合、パフォーマンスに心配があります。
DBサーバーのスペックをあげたり、目的に応じたデータマートを作ったりすれば
早くなりますかね。