0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Azure Databricksとは?

Last updated at Posted at 2025-05-08

はじめに

Azure Databricksは、Microsoft AzureとDatabricks社が共同開発した、Apache Sparkベースのビッグデータ分析サービスです。本記事では、Azure Databricksの基本概念、アーキテクチャ、操作手順を通して、初学者でも理解しやすい形で紹介します。


本記事のゴール

  • Azure Databricksの全体像を理解する
  • クラスタ作成からノートブックの操作までの基本操作を体験
  • データの読み込み、加工、保存の簡単なETLを試す

Azure Databricks とは

Azure Databricksは、Apache Sparkベースのクラウドデータ分析プラットフォームであり、データエンジニア、サイエンティスト、アナリストがコラボレーションできる環境を提供します。

  • スケーラブルなデータ処理基盤
  • ノートブック形式での開発と実行
  • Delta Lakeによる信頼性の高いストレージ

Databricks を利用するメリット

  • 簡単なUI操作でクラスター管理が可能
  • 多言語(Python, SQL, Scala, R)対応
  • Sparkベースの高速処理
  • Azureサービスとの高い統合性

基本的な Azure Databricks の操作手順

クラスターの作成

クラスターとは

Sparkジョブの実行環境であり、計算ノードの集合体です。DatabricksではUIから簡単に起動・停止が可能です。

クラスターの作成手順

  1. [Compute] タブを開く
  2. [Create Cluster] をクリック
  3. 名前・スペックを入力して作成

DBFS 内にデータのアップロード

DBFS とは

Databricks File System。Databricksワークスペースに統合された仮想ファイルシステム。

データの準備

CSVやParquetファイルを用意します(例:sample.csv)。

データのアップロード手順

  1. [Data] タブ → [Upload File]
  2. ファイルを選択し、/FileStore/ に保存

ノートブックの立ち上げ

  1. [Workspace] → [Create Notebook]
  2. 言語(例:Python)を選択
  3. クラスターをアタッチし、以下のようにコードを実行:
print("Hello, Databricks!")

データの簡単なETL処理(読み込み→加工→DBへ保存)

データの読み込み

df = spark.read.csv("/FileStore/sample.csv", header=True, inferSchema=True)
df.display()

データ加工

df_filtered = df.filter(df["column_name"] > 100)
df_filtered.createOrReplaceTempView("filtered_data")

Delta Lakeとして保存

df_filtered.write.format("delta").mode("overwrite").saveAsTable("sample_table")

データベースとテーブルの確認

SHOW TABLES;
DESCRIBE TABLE sample_table;

まとめ

Azure Databricksは、データ処理、分析、AIを一体化したパワフルなプラットフォームです。本記事では、クラスタ作成からノートブック操作、簡単なETL処理まで一連の流れを体験しました。次回はDelta Lakeの詳細や、SQLによる分析について掘り下げていきます。


参考リンク

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?