0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Databricks における Google Analytics Raw Data コネクターを試したみた

Last updated at Posted at 2025-10-13

概要

Databricks における Google Analytics Raw Data コネクターによる ingestion pipeline をDatabricks Free Edtion で試してみた結果を共有します。

Databricks における Google Analytics Raw Data コネクター機能とは、 Databricks とデータ連携を簡単に行える Lakeflow コネクター機能であり、 Google Analtyics 4 から BigQuery Export 機能によりエクスポートっした BigQuery からデータを連携する機能です。

image.png

出所:Lakeflowコネクトとは? | Databricks on Google Cloud

image.png

出所:Google Analytics 未加工データ コネクタの概念 | Databricks on Google Cloud

本手順を実施することで下記のようなパイプラインが構築され、データ連携が実施できます。また、そのパイプラインをジョブに登録することで自動化も可能です。

image.png

事前準備

環境準備

  • Databricks Free Edition
  • Google Cloud 環境

Google Analtyics 4 から BigQuery Export を設定

下記のドキュメントにて手順が紹介されています。

BigQuery Export 設定後、すぐにテーブルが作成されるわけではないことに注意してください。私は数日後に連携されていることを確認できました。

image.png

Databricks にてカタログとスキーマを作成

g4_rawというカタログとその配下にbq_dataというスキーマを作成しました。

image.png

検証手順

1. Google Cloud にてサービスプリンシパルを作成

image.png

2. サービスプリンシパルに対して権限を付与

必要な権限は下記です。

  1. BigQuery Data Viewer
  2. BigQuery Job User
  3. BigQuery Read Session User

image.png

Dataset スコープで BigQuery Data Viewer を付与したところ、下記のエラーとなりました。プロジェクトスコープで BigQuery Data Viewer で付与して対応しました。

image.png

com.databricks.pipelines.execution.conduit.common.DataConnectorException: [SAAS_CONNECTION_ERROR.BIGQUERY_INSUFFICIENT_PERMISSIONS] Failed to make a connection to the Google Analytics source. Error code: NO_BQ_DATA_VIEWER_ACCESS. The service account has insufficient permissions to ingest data from the BigQuery project {project_name}.
Please provide a service account with BigQuery Data Viewer, BigQuery Job User, and BigQuery Read Session User roles on the project that you'd like to ingest from.

image.png

3. サービスプリンシパルの認証キーを取得

image.png

4. Google Analytics Raw Data コネクターの ingestion pipeline の作成と初回実行

Databricks にてJobs & Pipelinesタグを選択し、Ingestion pipeline`を選択します。

image.png

Google anlytics Raw Dataを選択します。

image.png

+ Create connectionを選択します。

image.png

接続名を入力し、3. サービスプリンシパルの認証キーで取得した json の中身を張り付けて、Create connectionを選択します。

image.png

Pipline name 等を入力し、Crete pipeline and continueを選択します。

image.png

取得対象のテーブルを選択し、Nextを選択しま。テーブルが表示されるまでに数分かかることがあります。

image.png

書き込み対象のスキーマが確認のうえ、Save and continueを選択します。

image.png

Schedule や Notifications を設定の上(本記事では削除の上)で、Save and run pipelineを選択します。

image.png

初回連携が開始されることを確認します。

image.png

5. 実行結果を確認

データが連携されていることを確認します。

image.png

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?