0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Lakeflow パイプライン エディターを使用してLakeflow 宣言型 パイプライン を動かしてみる

Posted at

はじめに

Lakeflow パイプライン エディター の概要は以下です。
現時点(2025/8)ではベータ版の機能となります。

実際に動かす処理は以下のチュートリアルを使用しました。

事前準備

今回の内容は Free Edition 環境で実行しています。

環境が準備できたら、チュートリアルの手順0に従ってデータをセットアップします。

パイプラインの作成

「ジョブとパイプライン」から「ETL パイプライン」を選択

image.png

「Lakeflow パイプラインエディター」をオン

image.png

パイプライン名を入力、デフォルトのカタログ・スキーマを選択して「空のファイルで開始」を選択
(パイプライン名、カタログ・スキーマは後でも変えられるので適当で OK )

image.png

パイプラインのルートフォルダを選択(後からでも変更可能)

image.png

空のパイプラインが完成

image.png

フォルダ構成は以下のようにしてみました。

  • ldp_pipeline_asset_01:ルートフォルダ
  • pipeline:パイプラインソースコードフォルダ(パイプラインで実際に動くコードを格納する場所)
  • conf など:普通のフォルダ(モジュールとして使うファイル等を格納する場所、例としてここでは work フォルダにデータをセットアップしたノートブックを置いてます)

image.png

右上の「設定」を選択すると、コードアセットやデフォルトのカタログ・スキーマを変更できます。

image.png

image.png

処理の作成

ソースコードフォルダ配下の py ファイルに、チュートリアルの手順2~手順4の Python コードを貼り付け
( Volume パス等はご自身の環境に合わせて適宜修正してください)

image.png

実行方法は3種類

  • ドライラン:実際には処理されずにコードを確認できる
  • パイプラインを実行(デフォルト更新):新しいレコードを処理
  • テーブルを完全に更新して~~(フルリフレッシュ):すべてのレコードを再処理

image.png

実行結果は以下のように確認できます。

image.png

Tips

  • DAG は縦型にすると見やすいです

image.png

  • ソースコードはノートブックではなくファイルが推奨されています

image.png

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?