0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Fivetran の Managed Data Lakes Service を Azure Data Lake Storage Gen2 で構築する手順

Last updated at Posted at 2025-04-18

概要

Fivetran の Managed Data Lakes Service を Azure Data Lake Storage Gen2 で構築する手順を紹介します。Azure Databricks のカタログにテーブルを登録する手順も含めております。

Fivetran のドキュメントに記載されているSetup instructions for ADLSの手順をベースにしているため合わせてご確認ください。

image.png

出所:Fivetran for Managed Data Lakes Service | Setup Guide

本記事は下記記事の一部です。

image.png

出所:フルマネージドなデータ連携:データ統合の自動化を実現する Fivetran の全貌 #fivetran - Qiita

事前準備

  • Azure テナントの準備
  • Azure Databricks 環境の構築
  • Fivetran 環境の構築

手順

1. Create storage account

Azure Portal で Azure Data Lake Storage Gen2 用のストレージ アカウントを作成します。

image.png

2. Create ADLS container

先ほど作成したストレージ アカウント内にコンテナー(例:adls-container)を作成します。

image.png

3. Register an application and add a service principal

Microsoft Entra ID -> アプリの登録 -> + 新規登録を選択します。

image.png

名称(例:fivetran-service-principal)を入力し、登録を選択します。

image.png

作成したアプリのディレクトリ (テナント) IDアプリケーション (クライアント) IDを控えておきます。

image.png

4. Create client secret

証明書とシークレット -> + 新しいクライアント シークレットを選択します。

image.png

説明に任意の値(例:adls_secret)を入力し、追加を選択します。

image.png

表示されるを必ず控えておきます。

image.png

5. Assign role to container

ストレージ アカウントに移動し、アクセス制御(IAM) -> ロールの割り当ての追加を選択します。

image.png

ロールタブでストレージ BLOB データ共同作成者を選択し、次へを選択します。

image.png

メンバータブで先ほど作成したサービス プリンシパルを選択し、レビューと割り当てを選択します。

image.png

そのままレビューと割り当てを選択します。

image.png

Role assignmentsにサービス プリンシパルが追加されていることを確認します。

image.png

6. (Optional) Set up Unity Catalog

Databricks で作成したストレージを外部ロケーションとして登録します。認証方法には Databricks アクセス コネクターを使用します。

image.png

image.png

Databricks で SQL Warehouse を作成し、その情報を控えます。

image.png

image.png

Databricks アクセス トークンを取得し、その値を控えます。

image.png

image.png

image.png

image.png

image.png

カタログ(例:fivetran_catalog)を作成します。

image.png

7. Complete Fivetran configuration

Fivetran で Destinations -> Add destination を選択します。

image.png

Managed data lakes -> Azure Data Lake StorageSet up を選択します。

image.png

Destination name に任意の名称を入力し、Add を選択します。

image.png

Destination のセットアップ画面が表示されることを確認します。

image.png

セットアップ画面でストレージに関する情報を入力します。

image.png

続けてサービス プリンシパルに関する情報を入力します。

image.png

Consent URL 欄に記載されている URL をコピーします。

image.png

上記の URL を Azure にログインしているブラウザで開くとアクセス許可画面が表示されるようですが、環境によっては想定通りに動作しない場合があります。その際はコマンドラインで登録可能です。

image.png

コマンドラインでの登録手順は、以下の記事で整理されています。

image.png

出所:Fivetran の Managed Data Lakes Service 構築時に Azure に Fivetran-TenantBridge を作成できない場合の暫定対応方法 #fivetran - Qiita

上記の手順で登録したサービス プリンシパルに対して、ストレージへのストレージ BLOB データ共同作成者権限を付与します。

image.png

image.png

Destination のセットアップ画面で Update Databricks Unity Catalog のトグルをオンにし、Databricks の情報を入力します。

image.png

最後に Save for later を選択します。

image.png

8. Setup tests

作成した Destination を開き、Actions -> Test connection を選択します。

image.png

テストがパスすることを確認します。Fivetran Catalog Access Test が権限不足エラーとなる場合は、数分待ってから再度テストするとパスすることがあります。

image.png

データの同期確認

Fivetran に Sync の実施

Connections へ移動し、ソースタイプが Fivetran Platform のコネクションを選択します。

image.png

Start Initial Sync を選択します。

image.png

Initial sync が成功することを確認します。

image.png

Databricks にてデータを確認

指定したカタログ(例:fivetran_catalog)にデータが同期されていることを確認します。

image.png

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?