#概要
Googleアナリティクスの拡張eコマースを実装している環境で毎日3割ほどのトランザクションが抜け落ちていました(ひいてはアナリティクスのROASに影響)。この対応に当たった過程を記します。
この記録から言えることは以下2点です。
- データ収集の制約は意外と無視できない (特定した要因はこちら)
- コンバージョンが中途半端にしか計測できない問題の原因特定と対処は想定をはるかに超えて時間がかかることがある
#何が起きたか?
- トランザクション計測の抜け落ちが毎日2~3割発生している
(アナリティクスを参照:集客≫Google広告≫キャンペーン≫クリックExplorerを参照)
#問題の事前調査
①お客さんから実際のトランザクション履歴(トランザクションID・日付)をもらう(今回は過去3か月分)
②アナリティクスからトランザクション履歴をエクスポートする
(アナリティクスを参照:コンバージョン≫eコマース≫販売実績)
③どのくらい差異が出ているかの傾向を分析する
今回はDBとしてBigqueryに両者のデータをインポートしてSQLを実行した。
##どのくらい差異が出ているかの傾向を知るために実行するSQL
SELECT
alldata.transaction_datetime,
without_ga.transactions_not_in_ga,
alldata.all_transactions,
ROUND(1.0*without_ga.transactions_not_in_ga/alldata.all_transactions,2) not_in_ga_rate
FROM(
SELECT
r.transaction_datetime,
COUNT(r.transaction_id) AS transactions_not_in_ga
FROM ga_transaction_id g
RIGHT OUTER JOIN real_transaction_id r
ON g.transaction_id=r.transaction_id
WHERE g.transaction_id IS NULL
GROUP BY r.transaction_datetime) without_ga
RIGHT OUTER JOIN(
SELECT
transaction_datetime,
COUNT(transaction_id) AS all_transactions
FROM real_transaction_id
GROUP BY transaction_datetime) alldata
ON
without_ga.transaction_datetime=alldata.transaction_datetime
ORDER BY alldata.transaction_datetime DESC
#要因の詳細調査
##再現性の確認
- 検証方法:購入方法を全パターン試した
- 検証結果:正しくビーコン(HTTPリクエスト)がアナリティクスに送られている
- 詳細な検証方法:以下の手順で確認した
①ブラウザ(今回はChrome)の「デベロッパーツール≫ネットワーク」でcollect
を検索
②Request URL: https://www.google-analytics.com/j/collect?
のRequestParameters
を確認する
③ビーコンのti
に対し、実際に払い出されたトランザクションIDがセットされているか確認する。
##仮説1:埋め込まれているタグに誤りがある
- 検証方法:ソースコードを確認した
- 検証結果:ドキュメント通りのタグが埋め込まれていた
(ドキュメントを参照:拡張eコマース≫「トランザクションの測定」)
- 詳細な検証過程:以下のソースコードを確認した
<script>
//基本のアナリティクスタグ
(function(i,s,o,g,r,a,m){i['GoogleAnalyticsObject']=r;i[r]=i[r]||function(){
(i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date();a=s.createElement(o),
m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m)
})(window,document,'script','//www.google-analytics.com/analytics.js','ga');
ga('create', 'UA-****-2', 'auto');
//拡張eコマース用のコード
ga('require', 'ec');
</script>
...
<script type="text/javascript">
ga('ec:addProduct', {
id': '****',
name': '****',
category': '****',
brand': '****',
price': '****',
quantity': 1
});
ga('ec:setAction', 'purchase', {
id': '147570',
revenue': '****',
});
</script>
...
<script>
ga('send', 'pageview');
</script>
##仮説2:ビューの何らかのフィルタの影響を受けている
- 検証方法:お客さんにフィルタなしの新しいビューを作ってもらった
- 検証結果:傾向に変化はなかった
##仮説3:特定の商品を買うときのみサイトの動きが異なる
- 検証方法:最も計測漏れが起きている商品で購入し、ビーコンを確認
- 検証結果:問題は再現できなかった
(なお、トランザクションIDは完了画面のページで発行される=完了画面で生じる問題の可能性が高いため、この仮説が当てはまる可能性は元々とても低い)
- 詳細な検証過程:以下手順で確認した
①アナリティクスで計測できていないトランザクションのID一覧をお客さんに渡す。そして、商品マスターDBの商品・商品カテゴリ情報をそのIDに紐づけてもらう。
#アナリティクスで欠損しているトランザクションIDを抽出するためのSQL
SELECT
r.transaction_datetime,
r.transaction_id transaction_id_not_in_ga
FROM ga_transaction_id g
RIGHT OUTER JOIN real_transaction_id r
ON g.transaction_id=r.transaction_id
WHERE g.transaction_id IS NULL
ORDER BY r.transaction_id DESC
#SpreadsheetのQUERY関数でSQLを実行
=QUERY(A:F,"select A,B,count(A) where A is not null group by A,B order by count(A) desc",-1)
③最も頻度の高い商品で検証する
#結論
##特定された要因
上記までのように検証したがどれも仮説と合致せず、最終的には以下の結論に達した。
「アナリティクスのデータ収集上限に達しているセッション(ヒット数が500を超えるセッション)がある。」
- 検証方法:ヒット数が500を超えるセッションを抽出し、どのくらい影響を及ぼしているか推定する
- 検証結果:ヒット数が500を超えるセッションがなくなったときに解消が見込まれるトランザクション数は、実際に抜け落ちているトランザクションの数に近いため、この要因は尤もらしい
- 詳細な検証過程:以下手順で確認する
①データの収集上限に当てはまるセッションがどのくらいあるのかを見る
(セグメント≫条件)
→沢山あることが確認できた。
※500ヒット以上あるセッションが絞り込める(計測に問題が出るのは500ヒットを超えるセッションだが、500を超えるという条件は使えない)
②もう少し掘り下げてセッションやヒットの計測状況を見てみる
(カスタム≫カスタムレポート)
→イベントが大量に発火しているため、平均してPVの5倍のヒットがあるようだ。
③どのようなイベントが大量に計測されているのかを見る
→商品一覧画面でのイベント発火が全体の97%を占めている
④対策した際の効果を推定する
上記のようなイベントが過度に発火する問題が解消されると、トランザクション数の抜け落ちはどのくらい解消されるのか?
# | セグメント | データの種類 | データの総数 |
---|---|---|---|
① | 全てのユーザー | URL「/products/list.php」のその月の総PV | 724,839 |
② | 全てのユーザー | 本当のトランザクション数(お客さんからもらう) | 3,808 |
③ | 500hit以上あるセッション | URL「/products/list.php」のその月の総PV | 195,466 |
④ | 500hit以上あるセッション | トランザクション数の推定値(②÷①×③) | 1,026 |
→本記事の「事象」で確認したところ、実際に生じているアナリティクスのトランザクションデータの欠損数が「1035」であるのに対し、本要因を解消したときに計測できるようになるトランザクション数の推定値が「1026」であるため、この要因は尤もらしい。 |
##要因の要因
なぜイベントによるヒットが大量に飛んでいるのか?をもっと詳しく見ていく。
商品一覧画面で各商品のインプレッションデータをアナリティクスに送信している(参照: 商品インプレッションの測定)のだが、この際、一覧画面で出力される100個の商品データ全てを取得・送信しているため、ヒットが大量に計測されてしまっている。
- コード
ga('ec:addImpression', {...
で1つ1つの商品データをセットしている - 商品1つ1つに対しコード
ga('send', 'event', ...);
で商品データを送信している
##回避策
これを回避するために、以下の方法で送信するデータ回数を減らすことを検討する。
- PCおよびスマホの画面に表示された商品のみ商品データをセット・送信すること=送信する商品データをなるべくまとめること。
<!--例 - (1スクロールで表示される商品数8つごとにデータを送信)-->
<!--{if (商品データのインデックス+1)%8 == 0}-->
ga('send', 'event', '***', '***', '***', {'nonInteraction': 1});
<!--{/if}-->
- それでもヒット数が上限を超えてしまうセッションが見られる場合、アナリティクスのプロパティを拡張eコマース用に分けること
###制約事項
拡張eコマースのイベント発火時、アナリティクスへのデータ送信(HTTPリクエスト)1回あたりのサイズが8000バイト以下である必要がある(参照: Send Google Analytics Payload Length As Custom Dimension)
もし上記回避策で上限を超えてしまう場合、SKU以外の商品データ(日本語の商品名など)を送信しない という手段が考えられる。この場合そのままではレポートで一部商品のディメンションが使えなくなるが、商品データをアナリティクスにインポートすることで回避することができる。ただし、GA360でなければ過去に遡ってデータを付与することはできず、ビューフィルタのようにそのインポート後のデータにのみ適用される。
※関連記事
なお、商品データを除外することに関してこちらでメモを書いた。
「拡張eコマース - 一部項目を取得しないとGAのレポートでどう見えるのか?」
#その後
ヒットの計測が激減し、取れるトランザクションデータが70~75%→95%以上になった。
(Googleに聞いても改善できなくて困っていたとお客さんに喜んでもらえて嬉しかった)
何かあればお手数ですが、本記事か以下アカウントでお知らせください!
\ Follow Me! /
Qiitaアカウント
Twitterアカウント