Tableau用語集
Tableauで使われている専門用語についてまとめ、簡単な解説を加えた用語集です。
画面上のUI名称
ヘルプ Tableau ワークスペース
ヘルプ ビューの各部分
連続・不連続
連続とは数値や日付など値が連続している状態。緑。無限の範囲。データを定規の位置の点に割当するイメージ
不連続とは値が分断している状態。青。有限。データを名称ごとの箱に割当するイメージ
行列シェルフでは連続は軸を、不連続はヘッダーを作る
連続・不連続はユーザーが決定(データ型が文字列またはブールのディメンションは連続にはならない)
※画像引用:連続と不連続(Continuous and Discrete)
行と列
データの位置を決定する
青色(不連続)のフィールドを配置したときはヘッダーを作り
緑色(連続)のフィールドを配置したときは軸を作り位置の視覚属性を利用する
⇒Preattentive Attributesと視覚属性
メジャー・ディメンション
メジャー・ディメンションで基本的に気にすべきは、Viz-LOD。
メジャーはViz-LODで集計できる定量的データ(量的データ)を含むフィールド。
ディメンションはViz-LODに寄与する定性的データ(質的データ)を含むフィールド。
フィールドの色(連続・不連続)はメジャー・ディメンションに関係なし
★ヘルプ ディメンションとメジャー、青と緑
ブログ Tableau 8つのハードルを越える①「メジャーとディメンション」
ブログ Tableau 8つのハードルを越える⑤「メジャーのディメンションへの変身、ディメンションのメジャーへの変身」
★ブログ 連続と不連続(Continuous and Discrete)
動画 Tableau Tips 初級: 連続と不連続
ヘルプ ディメンションとメジャー、青と緑
ブログ Tableau 8つのハードルを越える②「連続と不連続 その1」
集計・非集計
フィールドに集計関数(SUMやAVGなど)を
含むと集計計算
含まないと非集計計算(行レベル計算)
★ブログ 集計と非集計を理解する
書籍 Tableau徹底入門
ヘルプ Tableau でのデータ集計
ブログ Tableau 8つのハードルを越える⑨「集計と非集計 その1」
メジャーネーム・メジャーバリュー
メジャーネームとメジャーバリューは複数のメジャーを可視化する際に便利な自動生成されたフィールド
3つ以上の指標がある場合、1つのフィールドで表せないのでメジャーバリューを使う。
この時、どのメジャーを使うかをメジャーネームでフィルタしたり、メジャーネームを行列や色に配置しメジャーバリューをわける。
★トレーニングビデオ メジャーネームとメジャーバリュー - Tableau
ヘルプ メジャー バリューとメジャー ネーム
ブログ Tableau 8つのハードルを越える⑥「メジャーネームとメジャーバリューその1」
クエリパイプライン(Order of Operation)
「クエリパイプライン」もしくは「Order of operation」と呼ばれる
Tableauが計算やフィルターを実行していく順序の事
以下は公式のヘルプにある処理順序の図。最低限フィルターの順序は覚える。
左はフィルター、右は機能
以下はその日本語版
※集計・非集計はViz-LODごとに集計するかしないかで区分
※出典:https://note.com/minoru_tech/n/n9bbd821563bf
以下はより詳細な処理の順序を図示したもの
※これを覚える必要はないですがエラーハンドリングの際に参照します。
※出典:Improved documentation of Order of Operations
★ブログ [Tableau Tips]Tableauの計算順序(クエリパイプライン)の覚え方と、もっと細かい情報
ヘルプ Tableau の操作の順序
ブログ Tableau 8つのハードルを越える⑫「クエリパイプライン ( オーダーオブオペレーション ) その1」
結合・リレーションシップ(関係)・ブレンド
データをつなぐときの方法。
ブレンドは制約が多いので避け、結合か関係を検討。
データの結合タイプ(内部結合や左外部結合)を指定したいのであれば結合。
正しい値がいい感じに出せればOKなら関係で良いかなと。。
Tableau公式は関係の利用を第一候補にしています。
ただ、関係を用いてパフォーマンスが落ちてしまうことがありました。
リレーションを20個繋いだり、100万行でカーディナリティが高いデータをキーにしてました。
このときTableauサポートの対応案として結合に変更することを提案されました。
関係ではなく、結合であればTableau上の動作としては早くなることが多いようです。
その時はデータ同士のモデリングの都合上関係を用いざるを得ませんでしたが、
パフォーマンスが不安なデータは結合のほうが良いのかもしれませんね。。
★書籍 Tableau徹底入門
ヘルプ データの関連付け
ヘルプ データの結合
ヘルプ データのブレンド
★ブログ 【TC19ブログ】Tableau新データモデリング(リレーションシップ)解説
ブログ Tableau 8つのハードルを越える⑳「ブレンディング(データブレンド) その1 導入編」
ブログ Tableau の 結合、リレーションシップ(リレーション)、データブレンド(ブレンディング)を理解する
表計算
表計算はビジュアライゼーション内の値に適用する計算。計算の方向の概念がある。
表計算関数を使用すると「△」のアイコンのついたフィールドで示される。
クエリパイプラインは遅いタイミングで処理される。
理論より、まずは感覚的にでも使えることが大事だと思っている機能です。
★書籍 Tableau徹底入門
ヘルプ 表計算での値の変換
ブログ Tableau 8つのハードルを越える㉕「表計算 その1 導入編」
ブログ 表計算を本気で理解する
LOD(Level of Detail)
LODは、データを集計する際の詳細レベル、つまり"集計粒度"。
〇Vizの集計粒度(Viz-LOD)
集計計算はVizの集計粒度(Viz-LOD)ごとに集計をして計算を行う。
このVizの集計粒度は図に示す赤枠にディメンションを配置すると変更される。
〇LOD計算(LOD表現)
Vizの集計粒度と異なる集計粒度で計算をするなど、集計粒度をコントロールをする計算式。
ほとんどの場合、LOD計算はFIXEDで「~ごと」の集計値を固定して使うために利用。
★ブログ VizLODを意識したTableau LOD計算【上達するのに苦労したからこそ教えたい】
ナレッジベース LOD 計算を使用して重複データを削除する
ブログ Tableau 8つのハードルを越える㉛「LOD計算 その1 粒度(LOD)とは」
ブログ LOD計算を本気で理解する
ブログ TableauのLOD計算を立体的にイメージしてみる。