▼結論
GA4のユーザー判別・ユーザー数算出の方法は、GA4のレポートIDの設定・Googleシグナルの設定有無によって変化する。そして、標準レポートと探索レポート、BigQueryへエクスポートしたデータにおいても表示されるデータが異なることがある。
レポートIDの設定ごとにまとめる
➀ハイブリッド(モデリングあり)
- 標準レポート
-
User-ID または デバイスID またはモデル化データによりユーザが判別される
- モデリングによりcookieの同意を拒否したユーザのイベントが補完される
- 表示されるユーザ数、その他イベントが多く表示されることになる
- Googleシグナル設定をオンにしていると、Googleアカウントにてログインかつ広告のカスタマイズ(chromeの設定)をオンにしているユーザの修正が行われることがある
- Googleアカウントにログインしており、違うブラウザやデバイスで訪問した人分のユーザ数が減ることがある
- モデリングによりcookieの同意を拒否したユーザのイベントが補完される
-
User-ID または デバイスID またはモデル化データによりユーザが判別される
- 探索レポート・BigQuery
- User-ID または デバイスIDによりユーザが判別される
- モデリングとGoogleシグナルの影響なし
- User-ID または デバイスIDによりユーザが判別される
➁計測データ(モデリングなし User-ID or デバイスID)
- 標準レポート
-
User-ID または デバイスIDによりユーザが判別される
- Googleシグナル設定をオンにしていると、Googleアカウントにてログインかつ広告のカスタマイズ(chromeの設定)をオンにしているユーザの修正が行われることがある
- Googleアカウントにログインしており、違うブラウザやデバイスで訪問した人分のユーザ数が減ることがある
- Googleシグナル設定をオンにしていると、Googleアカウントにてログインかつ広告のカスタマイズ(chromeの設定)をオンにしているユーザの修正が行われることがある
-
User-ID または デバイスIDによりユーザが判別される
- 探索レポート・BigQuery
- User-ID または デバイスIDによりユーザが判別される
- モデリングとGoogleシグナルの影響なし
- User-ID または デバイスIDによりユーザが判別される
③デバイスベース(モデリングなし デバイスIDのみ)
- 標準レポート
-
デバイスIDのみによりユーザが判別される
- Googleシグナル設定をオンにしていると、Googleアカウントにてログインかつ広告のカスタマイズ(chromeの設定)をオンにしているユーザの修正が行われることがある
- Googleアカウントにログインしており、違うブラウザやデバイスで訪問した人分のユーザ数が減ることがある
- Googleシグナル設定をオンにしていると、Googleアカウントにてログインかつ広告のカスタマイズ(chromeの設定)をオンにしているユーザの修正が行われることがある
-
デバイスIDのみによりユーザが判別される
- 探索レポート・BigQuery
- デバイスIDによりユーザが判別される
- モデリングとGoogleシグナルの影響なし
- デバイスIDによりユーザが判別される
▼補足説明
ここからは結論で記載した用語などについて説明する。
レポートID設定
GA4ではユーザをどのように判別するかを管理画面上で設定できる。この設定がユーザ数の算出方法を決める。
【設定画面】管理>プロパティ設定>データの表示>レポートID
以下の3種類が選べる。以下3種類はUser-ID,デバイスID,モデル化データという3つの識別子の使い方で分けられている。
- ハイブリッド
- User-IDにてユーザを判別、User-IDが無い場合はデバイスIDを使用する
- User-ID、デバイスID両方が使えない場合はモデル化データが使われる
- 計測データ
- User-IDにてユーザを判別、User-IDが無い場合はデバイスIDを使用する
- デバイスベース
- デバイスIDでのみユーザを識別する
ここからはUser-ID,デバイスID,モデル化データ, Googleシグナルについて説明する。
User-ID
個々のユーザにIDを振ることでユーザをデバイスによる影響なく識別できる。
ログインIDなどをイメージすると分かりやすい
設定としては、GTMにてgoogleタグの構成パラメータのuser_idにログインIDを設定することで行う
参考:Google公式 User-IDの設定方法
デバイスID
定義としては、ウェブサイトの場合はクライアントID、アプリの場合はアプリ インスタンスID を使用されます。
これはGA4のレポートID設定画面に記載がある
クライアントIDは、「_ga」という名前のCookieに保存される。写真のように、ランダムな番号とタイムスタンプの組み合わせによりデバイスごとにIDを振り分ける。
この値はCookieの値を使用していることからも分かるように、ブラウザを変えたりCookieの値が削除されたりなどすると新しいIDが付与される
参考:Google アナリティクス 4 のさまざまな ID を理解する
インスタンスIDは、アプリのインストールを一意に識別するID
モデル化データ
レポートID設定をハイブリットにした場合、
User-IDとデバイスIDの両方が使えない場合、つまりCookieの同意に対しユーザが拒否した場合はモデル化データが使われることになる。
ユーザがcookieの使用に同意しなかった場合はGA4の計測は行えない。そのようなデータを補完するためにgoogleは機械学習を使用している。
cookieの同意がなされなかったユーザのイベントは実際は行われているのに計測されていない。そうすると実際のユーザの行動よりも少ない数が計測されることになる。
そこで、googleは過去に計測されたユーザのイベントのデータを使ってcookieに同意しなかったユーザの行動を予測しているのだ。そして、その予測した行動データにてデータの補完を行っている。
Googleシグナル
レポートIDの設定とは別にGoogleシグナルという設定がある。
【設定画面】プロパティ設定>データの収集と修正>データの収集
この設定によってGoogleアカウントに紐づけられた情報についても一部収集出来るようになる。
Googleシグナルの設定をオンにすると、Googleアカウントにログインしており、広告のカスタマイズ(chromeの設定)をオンにしているユーザについてはGoogleアカウントの情報を元にユーザを判別する
PCでもwebでも同じgoogleアカウントにログインをしていれば同じユーザとして判別するということだ。
そして、それを元に標準レポートに表示されるユーザ数は修正される。
しかし、以下のような記載がある。これはどういうことだろうか
Google シグナルは Google アナリティクスのレポート用識別子からは除外されます
clickというイベントを行ったユーザ数を集計するとする。
この際にはレポートIDにて指定した識別子に加えてGoogleシグナルつまりGoogleアカウントの情報を使ってclickを行ったユーザ数を算出しようと思うかもしれない。
しかし、Googleシグナルの情報を識別子には使わずレポートIDの設定にて指定した識別子のみを識別子として使うと上記文言は言っているのだ。
まとめると、
Googleシグナルは、Googleアカウントの情報を使ってユーザを識別するものであり、標準レポートにてユーザ数を求める際に使用されることがある。しかし、ユーザ識別子に影響は与えない。