Edited at

Google Analytics360のデータをBigQueryで分析するための基礎知識

More than 1 year has passed since last update.

Google Analyticsの有料版である「Analytics360」を導入すると、Google AnalyticsのRAWデータをBigQueryにエクスポートして分析することができる。非常に素晴らしいソリューションなのだが、あまり情報がないため、基本的な情報とリファレンスへのリンクを整理しておく。

(作成中)


前提知識


Google Analytics360


BigQuery


GA360のBigQueryへのエクスポート


  • Google Analytics360はRAWデータをBigQueryにエクスポートすることができる。

  • GA360のデータをBigQueryにエクスポートするためには、予めGA360側で設定が必要になる。

  • GA360のデータをBigQuery上にエクスポートするとエクスポートしたビューID(数字7-9桁)のデータセットが作成される。

  • ga_sessions テーブルにデータが格納される。


    • BigQuery上はエクスポートの日付ごとに ga_sessions_YYYYMMDD というテーブルが作成される。




BigQuery上のデータ構造


データ構造のリファレンス


BigQuery上のデータの単位(=行の考え方)


  • 重要:GA360のエクスポートデータの行はセッションに対応している。


  • 重要:ただし、1セッションの中に ヒット(hits)単位で繰り返し 項目を持っている。

  • ヒットには、 ページ と イベント のような種類がある


    • ページ:セッション内でのページビューごとに自動生成(設定不要)

    • イベント:GA上でイベントをハンドリングするための設定をした場合のみ取得できる




BigQuery上の重要な項目・概念(=列の考え方)

BigQuery Export のスキーマのうち、特に重要な項目のみ抜粋しておく。



  • fullVisitorId


    • Cookie単位にユーザを識別するID




  • visitNumber


    • 当該ユーザのセッション数




  • visitId


    • セッションのID




  • hits.number


    • セッション内でのヒットの連番




  • hits.type


    • ヒットの種類




  • ページに関連する項目群


    • 参照したページのURLやタイトルは以下の項目に格納されている


      • hits.page

      • hits.page.pagePath

      • hits.page.pagePathLevel1

      • hits.page.pagePathLevel2

      • hits.page.pagePathLevel3

      • hits.page.pagePathLevel4

      • hits.page.hostname

      • hits.page.pageTitle






  • イベントに関する項目


    • イベントに関する情報は以下の項目に設定されている


      • hits.eventInfo

      • hits.eventInfo.eventCategory

      • hits.eventInfo.eventAction

      • hits.eventInfo.eventLabel

      • hits.eventInfo.eventValue






  • ディメンション


    • GA上でデータを分析するための軸。




  • カスタムディメンション


    • GA上で設定することで、自分で定義できるディメンション。


      • たとえば、ログインIDなどをカスタムディメンションに格納する、といった利用ができる。

      • customDimensions.index

      • customDimensions.value