はじめに
この記事は、私がデータ準備効率化ツール「Tableau Prep」を使って、Excelの処理をTableauで置き換えた際のノウハウをまとめたものです。
以下の点に注意して、ご覧ください。
- 独学なので、もっと効率がいい方法があるかもしれませんし、間違った方法が載っているかもしれません
- そもそもExcelをあまり使わないので、Excelの時点で非効率なことをしている可能性があります
- あくまでメモなので、体系的にまとまっているわけでなく、逐次書き加えていく形となります
ExcelをTableau Prepに置き換える際のレシピ集
列の挿入
Excelで以下のように列を挿入して、担当部署列を追加したいとしましょう。
この処理をTableau Prepで置き換えるときは計算フィールドを使います。
元のExcelに列を追加して正しい値を入れてもらったほうが当然いいのですが、元のExcelが諸々の都合で変更できない場合には便利です。
固定文字列以外にも、以下のように規則性がある場合は、計算フィールドで値を埋める条件を書いてやれば実現できます。
SUM関数を使った演算
以下のように各商品の売上がわかっている状態で、商品毎の売上シェアを出したい場合、エクセルだと 以下のようにSUM関数を使うと思います。
Tableau Prepではステップの中でSUM関数が使えないので、以下のような多段処理になります。
集計を追加して、SUM関数に相当する部分を計算します。以下では、総売上の部分が上記ExcelのSUM($E$2:$E$4)
に相当します。(厳密には一致しないのですが、説明の都合上端折っています。)
そして、集計の結果を元のデータと結合し、
計算フィールドでシェアを計算します。
Excelと比べて複雑に見えますが、ExcelだとSUMの範囲の指定の仕方によっては、間違った値になってしまうことがあります。例えば、SUM($E$1:$E$2000)
みたいなことをしている場合、2000行を超えると集計誤りが発生します。他にもSUM(E1:E100)
となっているのに気づかずコピペしてSUM(E101:E200)
になってしまい、集計誤りが発生するなどもありえます。Excelユーザのスキルレベルは千差万別なので、どういった問題が起こるかわかりませんし、セル単位で式が書かれているので正しさの検証がこんなんです。Prepではそういった問題が起こりにくくなる点で安心できます。
SUMIF関数を使った計算
SUMIF関数の場合でも、SUM関数と同様の方法が使えます。以下のように集計対象列があり、集計対象が"yes"
の場合のみシェアを出したいとしましょう。
この場合でも、フローの形は先程と全く同じになります。
変更点は、まず集計の際にグループ化したフィールドの中に集計対象の列を追加します。
そして、結合の際に集計対象の列も結合区に加えた上で、
シェアの計算の時点で残りのIFを追記すれば同じことができます。
Excelと違い、どのステップで何をするかを意識しないといけないですが、慣れてくるとExcelよりも条件に柔軟に追従できるのではないかと思います。
おわりに
今回は非常にシンプルな例だけを取り上げていますが、今後、業務や趣味で躓いた際には、このメモに書き加えていこうと思います。Tableau Prepはアップデートが激しいので、次のバージョンですぐに、もっと便利になるかもしれませんが、変更されるまでは自分用のメモとして書き溜めておこうと思います。