LoginSignup
0
0

More than 1 year has passed since last update.

DatabricksからLookerへの接続

Last updated at Posted at 2023-03-03

Connect to Looker | Databricks on AWS [2023/2/3時点]の翻訳です。

本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。

本書では、DatabricksクラスターやDatabricks SQLウェアハウス(以前のDatabricks SQLエンドポイント)でどのようにLookerを活用するのかを説明します。

重要!
persistent derived tables (PDTs)が有効化されている場合、Lookerはデフォルトで5分ごとに関連づけられているデータベースに接続してPDTを生成します。計算コストの増加を避けるためにデフォルトの頻度を変更することをお勧めします。詳細は、persistent derived tables (PDTs)の有効化と管理をご覧ください。

要件

手動でLookerに接続する前に以下のものが必要となります:

手動でLookerに接続する

手動でLookerに接続するには以下を実行します。

  1. LookerでAdmin > Connections > Add Connectionをクリックします。

  2. ユニークな接続Nameを入力します。

    ティップス
    接続名には小文字、数字、_のみを含めることができます。他の文字列が許容されることがありますが、あとで予期しない挙動を引き起こす可能性があります。

  3. DialectではDatabricksを選択します。

  4. Remote Hostには、要件にあったServer Hostnamを入力します。

  5. Portには、要件にあったPortを入力します。

  6. Databaseには、接続を通じてアクセスしたいワークスペースのデータベース名を入力します(defaultなど)。

  7. Usernameにはtokenと入力します。

  8. Passwordには、要件にあったパーソナルアクセストークンを入力します。

  9. Additional Paramsには、transportMode=http;ssl=1;httpPath=<http-path>を入力し、<http-path>を要件にあったHTTP Pathを入力します。

  10. PDT And Datagroup Maintenance Scheduleには、PDTの再生成のデフォルト頻度を変更するために適切なcronエクスプレッションを入力します。デフォルトの頻度は5分ごとです。

  11. クエリーを別のタイムゾーンに変換したい場合には、Query Time Zoneを調整します。

  12. 残りのフィールドはデフォルトのままにします。特に:

    • Max ConnectionsConnection Pool Timeoutはデフォルトのままにします。
    • (あなたがすべてをUTCで格納していることを前提として)Database Time Zoneはブランクのままとします。
  13. Test These Settingsをクリックします。

  14. テストが成功したらAdd Connectionをクリックします。

Lookerでデータベースをモデリングする

このセクションではプロジェクトを作成し、ジェネレーターを実行します。以下のステップは、接続するデータベースにパーマネントテーブルが格納されていることを前提としています。

  1. DevelopメニューでDevelopment Modeをオンにします。

  2. Develop > Manage LookML Projectsをクリックします。

  3. New LookML Projectをクリックします。

  4. ユニークなProject Nameを入力します。

    ティップス
    接続名には小文字、数字、_のみを含めることができます。他の文字列が許容されることがありますが、あとで予期しない挙動を引き起こす可能性があります。

  5. Connectionでは上で作成した接続名を選択します。

  6. 接続を通じてモデリングする別のデータベースがない限り、Schemasにはdefaultを入力します。

  7. 残りのフィールドはデフォルトのままとします。特に:

    • Starting PointGenerate Model from Database Schemaのままとします。
    • Build Views FromAll Tablesのままとします。
  8. Create Projectをクリックします。

プロジェクトを作成し、ジェネレーターを実行すると、Lookerはユーザーインタフェースに一つの.modelファイルと複数の.viewファイルを表示します。.modelファイルはスキーマ内のテーブルと、検知されたテーブル間のjoinリレーションを表示し、.viewファイルはスキーマ内のそれぞれのテーブルで利用できる個々のディメンション(カラム)を一覧します。

次のステップ

プロジェクトで作業を始めるには、LookerWebサイトの以下のリソースを参照ください。

persistent derived tables (PDTs)の有効化と管理

Lookerでは、persistent derived tables (PDTs)を作成することで、クエリーの時間とデータベースのロードを削減することができます。PDTは、Lookerがお使いのデータベースにスクラッチスキーマを書き込む派生テーブルです。Lookerは指定したスケジュールでPDTを再生成します。詳細はLookerドキュメントのPersistent derived tables (PDTs)をご覧ください。

データベース接続でPDTを有効化するには、当該の接続でPersistent Derived Tablesを選択し、画面に表示される手順を完了します。詳細については、LookerドキュメントのPersistent Derived TablesConfiguring Separate Login Credentials for PDT Processesをご覧ください。

PDTが有効化されると、Lookerはデフォルトで5分ごとに関連づけられているデータベースに接続してPDTを再生成します。Lookerは、関連づけられているDatabrikcsのリソースが停止している場合には、これを再起動します。データベース接続設定で、適切なcronエクスプレッションを用いてPDT and Datagroup Maintenance Scheduleを設定することでデフォルトの頻度を変更することをお勧めします。詳細については、LookerドキュメントのPDT and Datagroup Maintenance Scheduleをご覧ください。

PDTを有効化する、あるいは既存のデータベース接続設定のPDT再生成頻度を変更するには、Admin > Database Connectionsをクリックし、データベース接続設定のの隣のEditをクリックし、上述の指示に従います。

その他のリソース

Looker support

Databricks 無料トライアル

Databricks 無料トライアル

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0