本記事で理解出来ること
- 参照元/メディアとは?
- 参照元
- メディア
- 参照元/メディアの判定がどのように行われているか
- utmパラメータ
- リファラー
- スコープごとの参照元/メディア
- 最初のユーザーの参照元/メディア
- セッションの参照元/メディア
- 参照元/メディア
- BigQuery生データと参照元/メディアの対応、それらが記録されるタイミングとデータの引継がれ方
- page_viewイベントのイベントパラメータに記録されている
source
,medium
とtraffic_source.source
,traffic_source.medium
の違い
本記事では、GA4の「参照元/メディア」について仕組みの部分まで詳細に理解することを試みる
ざっくりまとめ
- 参照元/メディアは流入元を意味するもので、どの媒体(参照元)からどうやって(メディア)流入したかを意味する。
- utmパラメータが設定されていたらその値を、設定されていなかったらリファラーにて自動判定する。
- どちらも使えない場合にdirect/noneが計測される。
- 前に何も付かない参照元/メディアはキーイベントが起こったセッションの参照元/メディアの値が適用される
- BigQueryテーブルでは
traffic_source.source
,traffic_source.medium
が参照元/メディアに該当する - page_viewイベントのイベントパラメータに記録されている
source
,medium
とtraffic_source.source
,traffic_source.medium
には値の違いがあるため注意
▼参照元/メディアとは?
参照元/メディアは二つの要素からなる。参照元とメディアである。それぞれについて見る
参照元
どの媒体(誰)からの流入なのか ex)google,bing
メディア
その媒体の中でのどこからの流入なのか ex) organic,refferal
➡google / organicであれば、Googleという媒体の中でも自然検索にて流入したという意味
▼参照元/メディアの判定ロジック
結論:utmパラメータ > リファラーの順で決めている
utmパラメータが設定されていればその値を使い、参照元とメディアを設定する。
設定されていなければリファラーの値を使用し自動で参照元とメディアを判定する。
utmパラメータ
URLの末尾にgoogleが指定するutm_source
などのパラメータを含めるとその情報を元に流入元を判断するように出来る。
utmパラメータのutm_source
に対応するのが「参照元」であり、utm_medium
は「メディア」に対応する。
リファラー
リファラーは、ページに訪れる前のページの情報である。もう少し言うとHTTPリクエストに含まれる情報である。また、この値はブラウザにてdocument.refferer
で確認できる値である。
事例を元に参照元/メディアの判定ロジックを理解する
ページhttps://www.example.com
への流入を考える
➀以下のようなutmパラメータが設定されている場合
https://www.example.com/?utm_source=your-site&utm_medium=email
以上のページにユーザが訪れた場合の参照元/メディアの判定は以下
utm_source=your-site ➡ 参照元はyour-site
utm_medium=email ➡ メディアはemail
つまり、参照元/メディアはyour-site/email
となる
➁utmパラメータが設定されておらず、google検索にて流入した場合
計測しているページのリファラーを確認する(document.refferer)
➡https://www.google.com/
リファラーの値によって、googleからの流入であることが自動で判定される。
この時点で参照元はgoogle
であると決まる
続いて、メディアを判定する。
リファラーの値が存在するためrefferalかorganicかに絞られる。
googleが持っている検索エンジンリストのようなものにhttps://www.example.com
が存在するためこの流入は、自然検索からの流入であると判定する。
よってメディアをorganic
と決める。
つまり、参照元/メディアはgoogle/organic
となる
③utmパラメータが設定されておらず、ブックマークから流入した場合
計測しているページのリファラーを確認する。
➡ブックマークから流入したためリファラーの値が存在しない
➡参照元,メディアともに自動で判定出来ないためdirect/none
だと判定
▼スコープごとの参照元/メディア
参照元/メディアはスコープごとに3つ分かれる。
- 最初のユーザーの参照元/メディア
- セッションの参照元/メディア
- 参照元/メディア
3つのディメンションの違い
ディメンション名 | 意味 |
---|---|
ユーザの参照元/メディア | そのユーザの最初のセッションの参照元/メディア |
セッションの参照元/メディア | セッションの最初の参照元/メディア |
参照元/メディア | キーイベントが行われたセッションの最初の参照元/メディア |
「参照元/メディア」はキーイベントが行われたセッションに限定している点に注意
事例を元にスコープごとの参照元/メディアを理解する
1人のユーザが初訪問から三回のセッションを記録した例を考える。
セッション⑴ from Google検索 (参照元/メディア:google/organic)
session_start, page_view
セッション⑵ from ブックマーク (参照元/メディア:direct/none)
page_view, click
セッション⑶ from ブックマーク (参照元/メディア:direct/none)
page_view, click , purchase (キーイベント)
この場合、
ユーザの最初の参照元/メディア:google/organic
セッションの最初の参照元/メディア:➀google/organic
➁direct/none
③direct/none
参照元/メディア:direct/none
(キーイベントを記録した際のセッションの最初の参照元/メディア)
となる。
▼BigQuery生データと参照元/メディアの対応、それらが記録されるタイミングとデータの引継がれ方
参照元/メディアとBigQueryにエクスポートしたGA4データとの対応
traffic_source.source
,traffic_source.medium
というカラムが対応する。
セッションの参照元/メディアなどのディメンションには上記のカラムが使われていると予想する
参照元/メディアが記録されるタイミングとデータの引継ぎ
結論:session_startイベント発生時にtraffic_source.source
,traffic_source.medium
が取得されるイメージ。
そして、セッション内にて起こった全てのイベントに対しtraffic_source.source
,traffic_source.medium
が紐づけられる
▼page_viewイベントのイベントパラメータに記録されているsource
,medium
とBigQueryのtraffic_source.source
,traffic_source.medium
の違い
結論:
traffic_source.source
,traffic_source.medium
はsession_start時に記録されセッション内で引き継がれる値。
一方page_viewイベントのイベントパラメータに記録されているsource
,medium
はpage_viewごとに記録されるそのページのURLに含まれるutmパラメータの値である。
つまり、記録されるタイミングに違いがあり値としても異なる場合がある。
事例を見る
1人のユーザが同じセッション内にて以下のような行動を行ったとする。
⑴ページ`https://www.example.com?utm_source=hoge`にてsession_start
⑵clickイベント
⑶リロード(`https://www.example.com?utm_source=hoge`にてpage_viewが記録される)
⑷パラメータを以下URLのように手動で変えた上でリロード
`https://www.example.com?utm_source=fuga`➡page_viewイベントが記録される
この際のtraffic_source.source
とイベントパラメータsource
の違いを見ると以下のようになる
No | イベント名 | traffic_source.source | イベントパラメータsource
|
---|---|---|---|
1 | session_start | hoge | |
2 | click | hoge | |
3 | page_view | hoge | hoge |
4 | page_view | hoge | fuga |
▼おまけ
チャネルグループとの違いは?
参照元とメディアを文字列にて分類しなおしたのがチャネルグループ
分類の仕方は自分でカスタムできる
Google公式 流入元についての説明ページ