はじめに
こんな感じの項目ごとに数値を分類した表、よくエクセルで作ったりしますよね。これを「クロス集計表」といいます。この図では性別や年代別にアンケート結果をまとめています。もちろんこのクロス集計表もtableauでできます。
また、普段の業務でもABテストのように複数のものの結果を比較してどっちがパフォーマンスを検証する場面てあると思います。「本当にそのABテスト意味あるの?」ってことで統計的に検証する方法についても触れていきたいと思います。
クロス集計表とは?基礎知識と賢い活用法 | リサーチコラム
クロス集計表の作り方
今回も動画を見てイメージを掴んでみたいと思います。
Tableau(タブロー)のクロス集計の設定例です。
ざっくりいうと、行(「表側」)のところにカテゴリのような属性を入れていて、列(「表頭」)に年月を入れ、カテゴリごとと年ごとをかけ合わせた売上が見れるようになっています。
エクセルとかでもピボットテーブルを使えば簡単に作れますが、tableauでも簡単にできますね。
一応動画以外に参考として記事も載せておきます。
TableauでExcelのような「クロス集計表」を作る #10 | Web担編集部がゼロから学ぶ
検証
WEBマーケティングに関わっているとLPやバナー、タイトル文などのスプリットテストをすることってよくありますよね。
なんとなく「こっちのほうがCTR高いから効果あるんじゃないか」みたいな感じで結論づけてしまっていませんか。もしかしたら、たまたまそのときはそっちのバナーがよかっただけでインプレッション増やしてみたり、再度テストしてみたりしたら違う結果になることだって考えられます。
つまり、「本当にLPやバナーの違いが結果につながったのか」、はたまた偶然だったのか、誤差の範囲だったのか、その結果に意義があるのかを調べることを「検証(検定)」と言います。クロス集計表を作ってあれば、そんなこともできちゃいます。ここでは、そんなお話をします。
といいながら説明するのも面倒なのでこちらの動画を見てください。
【エクセルで統計分析】自店舗に効果的な宣伝方法は?(カイ二乗検定)
「カイ二乗検定:クロス集計表の2つのデータが影響しあっているかどうかを見る手法」
ということでここでは薬A/Bと症状の変化をクロスして表にしています。
「薬の違い」と「症状の変化」とに関係性があるかどうかをカイ二乗検定で検証します。
詳細は動画を見ていただいたほうがいいと思いますが、ざっくりどんなことをするかというと
− 薬A/Bそれぞれの合計に対する比率を出す
− 比率をもとに「予測値」を算出する
− 「実測値」と「予測値」を選んでエクセル関数CHISQ.TEST関数でP-値を算出する
ということをしています。
P-値は0.05を基準に判断がなされます。「0.05よりも小さい」とその差に意味がある(効果がある)とされ、「0.05よりも大きい」とその差に意味はない(効果はない)
つまり今回のものなら、
0.05よりも小さい→薬の違いに意味がある
0.05よりも大きい→薬の違いに意味がない
となります。
この考え方を使えば、薬A/BをバナーA/Bなどに置き換えて考えれば普段の業務でも使えそうですよね。
おわりに/参考
ということで、ほぼほぼエクセルのことじゃないか!と思われるかもしれないですが、とりあえずそういう概念があるよということを知っていただけたら良いかなと思っています。
参考としてtableauでカイ二乗検定をする記事があったので載せておきます。
TableauでABテストの検定結果を表示する方法
サンプルファイルも付いてたりするのでよければ見てみてください。
個人的には、カイ二乗検定は「別にtableauを使ってまでやることでもないな」(エクセル関数で事足りる)と思った次第ですが、クロス集計表をきれいに見やすく作るという点ではtableauが良いんじゃないかなと思います。
それと、ツール(WEB広告/LP配信ツールやスプリットテストのためのツール)によってはカイ二乗検定の機能も備えているものもあるようです。
以上、お粗末さまでした。
【Tableau Data Saber挑戦記】の最初の記事はこちら
こちらもぜひ
【Tableau Data Saber挑戦記】1. はじめます