2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

DatabricksAdvent Calendar 2022

Day 2

サンプルデータを用いてDelta Live Tablesパイプラインを作成・実行する

Posted at

こちらで紹介されている機能をウォークスルーします。

サンプルデータを用いてクイックにDelta Live Tables(DLT)の機能を試すことができます。

パイプラインの作成

  1. サイドメニューのワークフローをクリックします。
  2. Delta Live Tablesタブをクリックします。
  3. 左上にあるパイプラインを作成ボタンの右にある下向き矢印を展開し、サンプルデータからパイプラインを作成するを選択します。
    Screen Shot 2022-12-06 at 11.03.59.png
  4. パイプライン設定画面が表示されます。
    Screen Shot 2022-12-06 at 11.06.02.png
    • パイプラインの名前をパイプライン名に入力します。
    • クラスターポリシーを適用する際には、クラスターポリシーを選択します。
    • 自動でDLTノートブックが作成されますが、その際の言語を選択します。
    • DLTの処理によって生成されるDeltaテーブルをSQLでクエリーできる様にするためにターゲットスキーマにデータベース名を指定します。
      Screen Shot 2022-12-06 at 11.17.00.png
  5. 作成をクリックします。
  6. パイプラインの画面が表示されます。
    Screen Shot 2022-12-06 at 11.17.42.png

パイプラインの実行

  1. 開始をクリックしてパイプラインを実行します。
  2. クラスターが起動するとパイプラインのDAG(有効非巡回グラフ)が表示され、パイプラインの処理が実行されます。
    Screen Shot 2022-12-06 at 11.21.39.png

ノートブックの確認

  1. 処理が完了したらパイプラインのノートブックを確認してみます。パスに表示されているリンクをクリックします。
    Screen Shot 2022-12-06 at 11.23.15.png
  2. パイプラインの各ボックスの定義をSQLで確認することができます。
    Screen Shot 2022-12-06 at 11.24.15.png

データの確認

  1. サイドメニューのDataをクリックし、hive_metastore配下にある、パイプラインの作成で指定したターゲットスキーマを選択し、テーブルが作成されていることを確認します。
  2. テーブルの中身を確認することができます。
    Screen Shot 2022-12-06 at 11.26.57.png

まとめ

サンプルデータを用いてDLTをウォークスルーすることで、全体の操作、処理の流れを把握できるかと思います。ここで生成されたノートブックをカスタマイズして、ご自身のデータを用いてETLパイプラインを構築することも可能です。

Databricks 無料トライアル

Databricks 無料トライアル

2
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?