…なに言ってんだ? と思われるでしょうが、いいタイトルが思い浮かびませんでした。
どういう問題か?
想定してるデータはこんな感じです。
生徒名 | 旧基準 | 新基準 |
---|---|---|
田中 | 不合格 | 合格 |
佐藤 | 不合格 | 合格 |
鈴木 | 合格 | 合格 |
斎藤 | 合格 | 合格 |
山田 | 不合格 | 不合格 |
なにかの試験があって、その採点基準が変わった。
基準変化の前後で合格者数がどう変化したのかをみたい。
的なシチュエーションだと思ってください。
で、データには各生徒ごとに、旧基準で合格だったか、新基準で合格だったかが記録されています。
なので、やりたいことは同じ生徒について、旧基準ディメンションで切った時と、新基準ディメンションで切った時とを比較したい
ということになります。
これで少しタイトルの意味が通じるでしょうか…?
なにが問題か?
普通に比較すりゃいいじゃん、と自分も最初は思いましたが、いざやってみようと思うと、はて?となりました。
| 理想 | 現実 |
| --- | --- | --- |
| |
|
あれ? 横に並べて比較できない…?
なんで? 僕のTableauレベルが足りない?
とかうんうん悩んでもやっぱりできません。
要するにこれ、Tableauの不得意な横持ちデータなのです。
Tableauのデータは基本的に縦持ちであることが想定されています。
1レコードにいろんな情報が入ってるのが横持ちで、小さい単位で複数レコードに分けてあるのが縦持ちです。
↑のサンプルを見ると、新基準・旧基準の2種類の情報が1人の生徒に紐づいているので、横持ちなわけです。
自分だけかもしれませんが、このデータ横持ちじゃん! と気づくのはだいたい可視化でつまづいてから…。
解決策1 ピボットする
まず一番シンプルな解決策は、縦持ちにデータを変換してしまうことです。
横持ちになってるところ(今回は旧基準と新基準)を選択して、「ピボット」をクリック
1生徒につき、新旧の2レコードが紐づく形式になってますね。
あとはピボットでできたカラムには適当に名前をつけましょう。
でも、ピボットできない時もある
データをピボットできちゃうならそれが一番いいんですが、現実にはピボットできないケースも多々あります。
一番多いのは、計算フィールドを使って自分でディメンションを切っている場合ではないでしょうか。
例えば先ほどの例で、元データにあるのは生徒の点数で、それに対して計算フィールドで合格・不合格を判定しているとします。
旧基準の場合は70点以上で合格で、新基準だと60点以上が合格ライン、とかですね。
計算フィールドでできたデータは動的なものですから、それをベースにピボットできてしまうと、値が変わったときにどうなるんだ、とかいろいろ問題があるのでしょう。
解決策2 無理やり並べる
ピボットができなければ、あとはもう力技です。
まず、新基準と旧基準、それぞれ単体のシートを作ります。
| 新基準 | 旧基準 |
| --- | --- | --- |
| |
|
ほら、並べられましたね! 簡単でしょう!
…と言うと流石にちょっと雑なので、細かく調整します。
まずは旧基準の方の縦軸を非表示に。並べるときに右の軸は邪魔ですからね。
次に、新旧それぞれに、'新基準'のような文字列のディメンションをつけます。これがディメンションっぽく見えます。
あとは、それぞれシートタイトルを消して、ダッシュボードタイトルを設定して、判例をいじって、グラフの横幅を調整したら…
完成!!
まぁ、そこそこ見れるものになりましたね!
まとめ
Tableauは、用意された機能を使う分にはとても操作性良くスマートですが、そこから外れたことをやろうと思うと途端に泥臭いことをしなければならなくなります。
今回も、「ハック」と言ってしまって差し支えないレベルじゃないかと思います。
楽しくはありますが、ふと、「ここまでやるならPythonとかでグラフ作ったほうがいいんじゃ?」と思うこともなくはない…。