1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Delta Live Tablesのメンテナンスタスクのコストを追跡する

Posted at

DatabricksのDelta Live Tables(DLT)を用いることで、高信頼・高性能のデータパイプラインを容易に構築、管理できるようになります。

このDLTでは、宣言型でETLパイプラインを構築することで複雑なデータパイプラインを容易に構築でき、以下のようにパイプラインの可視性を高めることができます。
Screenshot 2023-01-21 at 7.19.46.png

そして、DLTでパイプラインを作成すると、パイプラインに含まれるDeltaテーブルをメンテナンスするメンテナンスタスクがデイリーで実行されるようになります。このタスクのコストを追跡したい際にどうするのかというのがタイトルの話という訳です。

Databricksのコストはアカウントコンソールの使用量で確認することができます。ただ、ここから上記のメンテナンスタスクのコストを切り出すには、事前の準備が必要になります。当該メンテナンスタスクを実行するクラスターにタグを追加することで、そのタグが紐付けられているタスクを切り出します。
Screenshot 2023-01-21 at 7.36.08.png

  1. 当該パイプラインの設定画面を開きます。
    Screenshot 2023-01-21 at 7.36.33.png

  2. 右上のJSONをクリックし、設定をJSON形式で表示します。
    Screenshot 2023-01-21 at 7.38.51.png

  3. clustersに以下のブロックを追加します。"label": "maintenance"でメンテナンスタスク用のクラスターを参照し、その配下に"custom_tags"で任意のタグを追加しています。以下の例では"Resource""DLT_Maintenance"というタグを追加していますが、任意のタグを追加することができます。

    JSON
    {
            "label": "maintenance",
            "custom_tags": {
                "Resource": "DLT_Maintenance"
            }
    }
    
  4. clustersは以下のようになります。これで、メンテナンスタスクのクラスターを"Resource""DLT_Maintenance"というタグで特定できるようになります。

    JSON
    "clusters": [
        {
            "label": "default",
            "autoscale": {
                "min_workers": 1,
                "max_workers": 1,
                "mode": "LEGACY"
            }
        },
        {
            "label": "maintenance",
            "custom_tags": {
                "Resource": "DLT_Maintenance"
            }
        }
    ]
    
  5. DLTパイプラインを実行します。これで上記設定が反映されたメンテナンスタスクが実行されるようになります。

  6. メンテナンスタスクが実行されるように、24時間待ちます。

  7. アカウントコンソールの使用量にアクセスし、タグ別を開くと、上で設定したタグResourceが表示されるはずです。これを選択するとタグResourceごとに集計された使用量が表示されます。
    Screenshot 2023-01-21 at 7.42.56.png

  8. 定義したDLT_Maintenanceが表示されています。
    Screenshot 2023-01-21 at 7.43.50.png

  9. より詳細に確認するには、右上のダウンロードボタンをクリックしてCSVファイルをダウンロードします。
    Screenshot 2023-01-21 at 7.43.50.png

  10. メンテナンスタスクのコストを確認することができます。
    Screenshot 2023-01-21 at 7.45.08.png

Databricks 無料トライアル

Databricks 無料トライアル

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?