5
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

DatabricksAdvent Calendar 2024

Day 2

Azure Data FactoryからDatabricksノートブックをシングルノードで実行する方法

Last updated at Posted at 2024-12-05

概要

Azure Data Factory から Databricks Notebook アクティビティにより Databricks のノートブックをシングルノードのジョブクラスターで実行する方法を共有します。データエンジニアリングなどのパイプラインを構築する際に、マルチノードが必要でないような処理を行うことがよくあり、そういった場合にはコスト削減につながります。いくつかの制約があることに注意して利用するようにしてください。

Azure Data Factory のリンクサービスにて、追加のクラスター設定を以下のように設定することで、シングルノードとなります。

# 分類 名前
1 クラスター Spark conf spark.databricks.cluster.profile singleNode
2 クラスター Spark conf spark.master local[*]
3 クラスターのカスタム タグ ResourceClass SingleNode

image.png

image.png

シングルノードとは

Databricksにおけるシングルノード(Single Node)クラスターは、すべての処理が1つのノード(VM)上で実行される特殊なクラスター構成です。大量のデータ処理には適していませんが、少量のデータを扱うジョブや単一ノードの機械学習ライブラリなど、分散処理を必要としないワークロードに適しています。Databricks の課金単位である DBU も低くなることから、コストの最適化が可能となります。

image.png

単一ノード コンピューティングは、少量のデータを使用するジョブや、単一ノードの機械学習ライブラリなどの非分散ワークロードを対象にしています。

引用元:コンピューティング構成リファレンス - Azure Databricks | Microsoft Learn

シングルノードを利用する際の制限事項が下記のドキュメントに記載されており、利用時には確認してください。

image.png

引用元:コンピューティング構成リファレンス - Azure Databricks | Microsoft Learn

実行手順

1. 事前準備

1-1. カタログとスキーマを作成

以下のSQLコマンドでカタログとスキーマを作成します。

%sql
CREATE CATALOG IF NOT EXISTS qiita_test_01;
CREATE SCHEMA IF NOT EXISTS qiita_test_01.schema_01;

image.png

1-2. テーブルを作成

サンプルデータを使用してテーブルを作成します。

%sql
CREATE OR REPLACE TABLE qiita_test_01.schema_01.nation
SELECT
  *
  FROM
    samples.tpch.nation

image.png

1-3. 実行するノートブックを作成

作成したテーブルからデータを SELECT するノートブックを作成します。

%sql
SELECT
  *
  FROM
    qiita_test_01.schema_01.nation

image.png

2. Azure Data Factory にてパイプラインを作成

2-1. Databricks のリンクサービスを作成

追加のクラスター設定を以下のように設定します。

# 分類 キー
1 クラスター Spark conf spark.databricks.cluster.profile singleNode
2 クラスター Spark conf spark.master local[*]
3 クラスターのカスタム タグ ResourceClass SingleNode

image.png

2-2. Databricks Notebook アクティビティをもつパイプラインを作成

image.png

3. Azure Data Factory から Databricks のノートブックを実行と確認

3-1. パイプラインを実行

パイプラインを実行してノートブックを起動します。

image.png

3-2. シングルノードのクラスターが作成されたことを確認

実行時にシングルノードのクラスターが作成されていることを確認します。

image.png

3-3. ノートブックが実行されたことを確認

ノートブックが正常に実行されたことを確認します。

image.png

5
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
5
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?