Help us understand the problem. What is going on with this article?

拡張eコマース - アナリティクスのトランザクションが毎日3割欠落する問題への対処記録

概要

Googleアナリティクスの拡張eコマースを実装している環境で毎日3割ほどのトランザクションが抜け落ちていました(ひいてはアナリティクスのROASに影響)。この対応に当たった過程を記します。

この記録から言えることは以下2点です。

  • データ収集の制約は意外と無視できない
  • コンバージョンが中途半端にしか計測できない問題の原因特定と対処は想定をはるかに超えて時間がかかることがある

何が起きたか?

  • トランザクション計測の抜け落ちが毎日2~3割発生している transaction-gap-trend-between-analytics-vs-real.png
  • そのため、アナリティクスレポートのROASの分子(収益)に影響を及ぼしている

(アナリティクスを参照:集客≫Google広告≫キャンペーン≫クリックExplorerを参照)
google-analytics-roas-by-click-explorer-ads-report.png

問題の事前調査

①お客さんから実際のトランザクション履歴(トランザクションID・日付)をもらう(今回は過去3か月分)
②アナリティクスからトランザクション履歴をエクスポートする
(アナリティクスを参照:コンバージョン≫eコマース≫販売実績)
enhenced-ecommerce-transaction-history.png

③どのくらい差異が出ているかの傾向を分析する
今回はDBとしてBigqueryに両者のデータをインポートしてSQLを実行した。

##どのくらい差異が出ているかの傾向を知るために実行するSQL
SELECT 
  alldata.transaction_datetime,
  without_ga.transactions_not_in_ga,
  alldata.all_transactions,
  ROUND(1.0*without_ga.transactions_not_in_ga/alldata.all_transactions,2) not_in_ga_rate
FROM(
  SELECT 
    r.transaction_datetime,
    COUNT(r.transaction_id) AS transactions_not_in_ga
  FROM ga_transaction_id g
  RIGHT OUTER JOIN real_transaction_id r
  ON g.transaction_id=r.transaction_id
  WHERE g.transaction_id IS NULL
  GROUP BY r.transaction_datetime) without_ga
RIGHT OUTER JOIN( 
  SELECT 
    transaction_datetime,
    COUNT(transaction_id) AS all_transactions
  FROM real_transaction_id
  GROUP BY transaction_datetime) alldata
ON
  without_ga.transaction_datetime=alldata.transaction_datetime
ORDER BY alldata.transaction_datetime DESC

要因の詳細調査

再現性の確認

  • 検証方法:購入方法を全パターン試した
  • 検証結果:正しくビーコン(HTTPリクエスト)がアナリティクスに送られている
  • 詳細な検証方法:以下の手順で確認した

①ブラウザ(今回はChrome)の「デベロッパーツール≫ネットワーク」でcollectを検索
Request URL: https://www.google-analytics.com/j/collect?RequestParametersを確認する
③ビーコンのtiに対し、実際に払い出されたトランザクションIDがセットされているか確認する。
image.png

仮説1:埋め込まれているタグに誤りがある

  • 検証方法:ソースコードを確認した
  • 検証結果:ドキュメント通りのタグが埋め込まれていた

(ドキュメントを参照:拡張eコマース≫「トランザクションの測定」)

  • 詳細な検証過程:以下のソースコードを確認した
thanks.html
<script>
//基本のアナリティクスタグ
(function(i,s,o,g,r,a,m){i['GoogleAnalyticsObject']=r;i[r]=i[r]||function(){
(i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date();a=s.createElement(o),
m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m)
})(window,document,'script','//www.google-analytics.com/analytics.js','ga');
ga('create', 'UA-****-2', 'auto');

//拡張eコマース用のコード
ga('require', 'ec');
</script>

...

<script type="text/javascript">
ga('ec:addProduct', {
id': '****',
name': '****',
category': '****',
brand': '****',
price': '****',
quantity': 1
});
ga('ec:setAction', 'purchase', {
id': '147570',
revenue': '****',
});
</script>

...

<script>
ga('send', 'pageview');
</script>

仮説2:ビューの何らかのフィルタの影響を受けている

  • 検証方法:お客さんにフィルタなしの新しいビューを作ってもらった
  • 検証結果:傾向に変化はなかった

仮説3:特定の商品を買うときのみサイトの動きが異なる

  • 検証方法:最も計測漏れが起きている商品で購入し、ビーコンを確認
  • 検証結果:問題は再現できなかった

(なお、トランザクションIDは完了画面のページで発行される=完了画面で生じる問題の可能性が高いため、この仮説が当てはまる可能性は元々とても低い)

  • 詳細な検証過程:以下手順で確認した

①アナリティクスで計測できていないトランザクションのID一覧をお客さんに渡す。そして、商品マスターDBの商品・商品カテゴリ情報をそのIDに紐づけてもらう。

#アナリティクスで欠損しているトランザクションIDを抽出するためのSQL
SELECT 
    r.transaction_datetime,
    r.transaction_id transaction_id_not_in_ga
FROM ga_transaction_id g
RIGHT OUTER JOIN real_transaction_id r
ON g.transaction_id=r.transaction_id
WHERE g.transaction_id IS NULL
ORDER BY r.transaction_id DESC

②最も計測漏れが起きている商品でを抽出する
spreadsheet-query-select-transaction-data-gap-of-analytics-vs-real.png

#SpreadsheetQUERY関数でSQLを実行
=QUERY(A:F,"select A,B,count(A) where A is not null group by A,B order by count(A) desc",-1)

③最も頻度の高い商品で検証する

結論

特定された要因

上記までのように検証したがどれも仮説と合致せず、最終的には以下の結論に達した。

アナリティクスのデータ収集上限に達しているセッション(ヒット数が500を超えるセッション)がある。」

  • 検証方法:ヒット数が500を超えるセッションを抽出し、どのくらい影響を及ぼしているか推定する
  • 検証結果:ヒット数が500を超えるセッションがなくなったときに解消が見込まれるトランザクション数は、実際に抜け落ちているトランザクションの数に近いため、この要因は尤もらしい
  • 詳細な検証過程:以下手順で確認する

①当てはまるセッションがどのくらいあるのかを見る
(セグメント≫条件)
segment-sessions-having-over-500hits.png
→沢山あることが確認できた。
※500ヒット以上あるセッションが絞り込める(計測に問題が出るのは500ヒットを超えるセッションだが、500を超えるという条件は使えない)

②もう少し掘り下げてセッションやヒットの状況を見てみる
(カスタム≫カスタムレポート)
transaction-gap-caused-by-many-hits-of-event.png
→イベントが大量に発火しているため、平均してPVの5倍のヒットがあるようだ。

③どのようなイベントが大量に計測されているのかを見る
→商品一覧画面でのイベント発火が全体の97%を占めている
analytics-event-report-for-transaction-gap-research.png

④対策した際の効果を推定する
上記のようなイベントが過度に発火する問題が解消されると、トランザクション数の抜け落ちはどのくらい解消されるのか?

estimate-the-effect-of-handling-for-the-cause-of-transaction-gap.png

# セグメント データの種類 データの総数
全てのユーザー URL「/products/list.php」のその月の総PV 724,839
全てのユーザー 本当のトランザクション数(お客さんからもらう) 3,808
500hit以上あるセッション URL「/products/list.php」のその月の総PV 195,466
500hit以上あるセッション トランザクション数の推定値(②÷①×③) 1,026

→本記事の「事象」で確認したところ、実際に生じているアナリティクスのトランザクションデータの欠損数が「1035」であるのに対し、本要因を解消したときに計測できるようになるトランザクション数の推定値が「1026」であるため、この要因は尤もらしい。

要因の要因

なぜイベントによるヒットが大量に飛んでいるのか?をもっと詳しく見ていく。

商品一覧画面で各商品のインプレッションデータをアナリティクスに送信している(参照: 商品インプレッションの測定)のだが、この際、一覧画面で出力される100個の商品データ全てを取得・送信しているため、ヒットが大量に計測されてしまっている。

  • コードga('ec:addImpression', {...で1つ1つの商品データをセットしている
  • 商品1つ1つに対しコードga('send', 'event', ...);で商品データを送信している

回避策

これを回避するために、以下の方法で送信するデータ回数を減らすことを検討する。

  • PCおよびスマホの画面に表示された商品のみ商品データをセット・送信すること=送信する商品データをなるべくまとめること。
<!--例 - (1スクロールで表示される商品数8つごとにデータを送信)-->
<!--{if (商品データのインデックス+1)%8 == 0}-->
 ga('send', 'event', '***', '***', '***', {'nonInteraction': 1});
<!--{/if}-->
  • それでもヒット数が上限を超えてしまうセッションが見られる場合、アナリティクスのプロパティを拡張eコマース用に分けること

制約事項

拡張eコマースのイベント発火時、アナリティクスへのデータ送信(HTTPリクエスト)1回あたりのサイズが8000バイト以下である必要がある(参照: Send Google Analytics Payload Length As Custom Dimension)

もし上記回避策で上限を超えてしまう場合、SKU以外の商品データ(日本語の商品名など)を送信しない という手段が考えられる。この場合そのままではレポートで一部商品のディメンションが使えなくなるが、商品データをアナリティクスにインポートすることで回避することができる。ただし、GA360でなければ過去に遡ってデータを付与することはできず、ビューフィルタのようにそのインポート後のデータにのみ適用される。

※関連記事
なお、商品データを除外することに関してこちらでメモを書いた。
拡張eコマース - 一部項目を取得しないとGAのレポートでどう見えるのか?


何かあればお手数ですが、本記事か以下アカウントでお知らせください!

\ Follow Me! /
Qiitaアカウント
Twitterアカウント

Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Comments
Sign up for free and join this conversation.
If you already have a Qiita account
Why do not you register as a user and use Qiita more conveniently?
You need to log in to use this function. Qiita can be used more conveniently after logging in.
You seem to be reading articles frequently this month. Qiita can be used more conveniently after logging in.
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away