1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Databricks DLTのマルチファイルエディタ

Last updated at Posted at 2025-04-23

Databricksのデータパイプライン開発・運用ソリューションのDLT(旧称Delta Live Tables)の大幅なアップデートです。

DLTにおけるETLパイプライン開発のマルチファイルエディタ
ETLパイプラインの開発、デバッグのためにDLTで新たなマルチファイルエディタを使えるようになりました。このマルチファイルエディタでは、パイプラインアセットブラウザに一連のファイルとしてパイプラインを表示します。一箇所でファイルを編集し、パイプラインの設定やどのファイルをパイプラインに含めるのをコントロールすることができます。DLTのマルチファイルエディタを用いたETLパイプラインの開発およびデバッグをご覧ください。

注意
執筆時点ではベータ版です。

マニュアルはこちらです。

機能の有効化

プレビューで、Pipelines multi-file developer experienceをオンにします。

Screenshot 2025-04-23 at 14.15.20.png

また、各人の設定の開発者ノートブックとファイルのタブをオンにします。

サイドメニューのパイプラインからETLパイプラインの作成をクリックすると、以下のようなダイアログが表示されるので、ETLエディタを有効化をクリックします。

Screenshot 2025-04-23 at 14.18.51.png

パイプラインの作成

今回は以下のチュートリアルに沿ってパイプラインを作成します。

以下のようなダイアログが表示されるので、パイプライン名とデフォルトカタログ、デフォルトスキーマを指定します。

Screenshot 2025-04-23 at 14.24.43.png

高度なパイプラインを作成リンクをクリックすると、より詳細な設定を行える画面(以前からあるパイプライン作成画面)に遷移します。

Screenshot 2025-04-23 at 15.10.12.png
Screenshot 2025-04-23 at 15.09.47.png

マルチファイルエディタ

作成をクリックすることで、マルチファイルエディタの画面が開きます。

Screenshot 2025-04-23 at 15.10.26.png

左がアセットブラウザ、中央上がソースコード、右がパイプラインのDAG、下がテーブル(マテリアライズドビュー、ストリーミングテーブル)情報が表示されます。画面構成の詳細はこちらをご覧ください。

パイプライン作成と同時にデフォルトのフォルダ構成や、サンプルファイルも作成されるのでこれらを変更していきます。

Screenshot 2025-04-23 at 15.14.04.png

このエディタにおいて新たにルートフォルダというコンセプトが導入されました。これは、パイプラインごとに設定されるフォルダです。このフォルダ配下にソースコードを格納することで、マルチファイルエディタをスムーズに活用できます。ルートフォルダ配下のソースコードをパイプラインに含めるかどうかを選択することができます。

Screenshot 2025-04-23 at 15.39.01.png

ドライラン

以前は検証と言っていた機能です。データの処理は行わずにロジックの検証のみを行います。

Screenshot 2025-04-23 at 15.14.39.png

画面右にはパイプラインのグラフ構造、下にはパイプラインに含まれるテーブルの一覧が表示されます。グラフ構造は縦横を切り替えることができます。

Screenshot 2025-04-23 at 15.14.46.png

パイプラインの実行

ドライランの右のパイプラインを実行をクリックすることで、パイプラインを実行します。

Screenshot 2025-04-23 at 15.17.53.png

テーブルの確認

テーブル一覧のテーブル名をクリックすることで、直接テーブルの中身を確認できます。

Screenshot 2025-04-23 at 15.48.32.png

処理のパフォーマンスメトリクスも確認できます。

Screenshot 2025-04-23 at 15.49.56.png

設定の変更

画面上の設定をクリックすることで、パイプラインの設定自体を変更できます。以前はパイプライン画面への遷移が必要でした。

Screenshot 2025-04-23 at 15.20.32.png

イベントログ

右下のインジケータをクリックし、イベントログを表示をクリックすることで、イベントログにアクセスできます。

Screenshot 2025-04-23 at 15.20.41.png
Screenshot 2025-04-23 at 15.20.46.png

リネージ

DLTパイプラインのリネージは従来通りカタログエクスプローラで確認できます。以前はボリュームのリネージが取れていませんでしたが、追跡されるようになっていました。

Screenshot 2025-04-23 at 15.26.07.png

まとめ

複数ファイルの管理、ソースコード開発、DAGの確認、パイプラインによって生成されるテーブルの中身の確認、イベントログの確認、パイプラインの設定がすべて一つの画面で行えますので、画面の移動が減ることは間違いありません。是非ご活用ください!

はじめてのDatabricks

はじめてのDatabricks

Databricks無料トライアル

Databricks無料トライアル

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?