今回はデータ結合のリレーションシップというものがとても便利ではある反面、まだ初心者である私の中ではブラックボックス化しすぎて、今後何か問題が起きた際に対処できる気がしなかったので、早めに理解と記録を残しておくことにしました。
まずリレーションシップの公式な説明としては以下となっています。
「固定された出力を分析前に作成する結合とは異なり、リレーションシップは分析中に複数の表を組み合わせてデータを集計し、Viz 内のフィールドとフィルターに基づいて、必要な詳細レベルでデータにクエリを実行します。」
個人的によくわからなかったので、以下でまとめました。
結論
※結合計算以外はリレーションシップを使うと良い
キーとして使いたいそれぞれデータの持ち方が違い、データの形を合わせる必要がある場合は結合計算が必要になるため、リレーションが使えない。
逆にそれ以外は基本リレーションを使っておけば良い。
(認識としてこのような大まかな認識は大いによろしくないですが、tableauを触ってまだ一ヶ月も経っていないため、あれやこれや色々把握するよりも、問題に出会えば少しずつ対処して覚えていくようにします。2023/9/21現在以降何か発見すればこちらの記事に追記していきます。)
上記認識で今後リレーションシップを活用しつつ、個人的な知識の定着としてリレーションシップを以下でまとめてみました。
実際の挙動
リレーションシップの場合
注文NO | 注文日付 | 注文数量 |
---|---|---|
A | 2020/1/10 | 100 |
A | 2020/1/11 | 50 |
B | 2020/1/12 | 200 |
C | 2020/1/13 | 300 |
+(注文NOで集計)
注文NO | 注文日付 | 返品数量 |
---|---|---|
A | 2020/2/1 | 150 |
↓
注文NO | 注文数量 | 返品数量 |
---|---|---|
A | 150 | 150 |
ジョインの場合
注文NO | 注文日付 | 注文数量 |
---|---|---|
A | 2020/1/10 | 100 |
A | 2020/1/11 | 50 |
B | 2020/1/12 | 200 |
C | 2020/1/13 | 300 |
+(注文NOで集計)
注文NO | 注文数量 | 返品数量 |
---|---|---|
A | 2020/2/1 | 150 |
A | 2020/2/1 | 150 |
↓複製されてしまう
注文NO | 注文数量 | 返品数量 |
---|---|---|
A | 100 | 150 |
A | 50 | 150 |
結果下記のように返品数量が間違った値で結合されてしまう
注文NO | 注文数量 | 返品数量 |
---|---|---|
A | 150 | 300 |
まとめ
他にも調べるとイメージを持って取り組むことが大事なようでしたので、どんどんタスクを進めながら、何か知識に進展があれば追記しています。