0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

🔐Azure × Databricks🔐: ACL vs RBACの違いを実務的に理解

0
Posted at

Azure × Databricks

unnamed (2).png

📚 関連書籍

クラウドでデータ基盤を作ろうとすると、Azure・Storage・ネットワーク・権限・セキュリティ…そこに Databricks が加わった瞬間、一気に難易度が跳ね上がります。
「結局どこから理解すればいいの?」
「Private Link むずかしすぎない?」
「Unity Catalog って実務ではどう扱うの?」
——そんな “最初のつまづき” を丁寧にほどいていくのが本書です。
👉 https://amzn.to/4ocWcJI

ACL vs RBACの違いを実務的に理解

Databricks × ADLS Gen2 の構成で最も多いトラブルは「権限関連」です。
“RBAC を付けたのにアクセスできない”
“Permission Denied が出る理由がわからない”
“Unity Catalog で SELECT 権限を付けたのに読み込めない”

これらが起きる理由は RBAC・ACL・Unity Catalog の役割が違うからです。

Databricksのアクセス構造は「三層モデル」になっており、RBAC だけでは不十分、ACL だけでも動かない、Unity Catalog だけでは制御できない領域があります。

この違いを理解することは、レイクハウス運用の最重要ポイントです。


1. 🔐 RBACの本質:Storage Accountに入る前の“入館証”

RBAC(Role-Based Access Control)は、Azure のリソース管理の中心であり、「そのリソースにアクセスできるかどうか」を決める入口の仕組みです。

RBACとは何か?

  • Azure Portal やアプリ(Databricks PMI)が Storage Account を操作できるか?
  • Container/Directory/File に到達する前の最初のチェックポイント
  • “Storage Blob Data Contributor” を付けるかどうかが最重要

RBACでできること

  • Storage Account 全体へのアクセス権限付与
  • Container 作成・削除、Properties の操作
  • SAS トークンの操作など上位レベルの管理操作

RBACだけではできないこと

  • ディレクトリの中身を読む
  • Deltaファイルに書き込む
  • ACLで拒否されている場所にアクセスする

つまり RBAC は「Storage に入るための入館証」であり、実データ操作とは別物です。

まとめると、RBACは「Storageという建物に入る」ための権限です。


2. 📂 ACLの本質:データそのものを触る“実務権限”

ACL(Access Control List)は、ADLS Gen2 の階層型ファイルシステムに備わる、フォルダ/ファイル単位の詳細なアクセス制御機能です。

ACLとは何か?

  • Directory や File を“触れるかどうか”
  • POSIX 権限ベース(rwx)
  • Delta Lake を扱ううえで欠かせない

ACL は実データの鍵です。
RBAC を付けていても ACL が拒否していたら Permission Denied になります。

ACLが必要な理由

Databricksで扱う Delta Lake は
「1テーブル=1フォルダ+複数ファイル」
という構造を持ちます。

そのフォルダに ACL がないと、

  • SELECT
  • INSERT
  • MERGE
  • OPTIMIZE
    いずれもエラーになります。

RBAC vs ACL の関係

  • RBAC は上位の建物(Storage Account)の権限
  • ACL は部屋(Directory / File)の権限
  • 両方揃って初めてデータが触れる

まとめると、ACLはデータレベルの“細粒度の許可証”です。


3. 🚀 RBAC × ACL × Unity Catalog:三層で理解するとエラーが消える

Databricks では、RBAC・ACL・Unity Catalog の三層でデータアクセスが構成されます。
どれか1つが欠けても動作は失敗します。


🔹 RBAC(Azure側)

Storage に入るための入館証
Storage Blob Data Contributor


🔹 ACL(物理層)

Directory / File を読む・書く実務権限
rwx の付与(フォルダ/ファイル)


🔹 Unity Catalog(論理層)

SQL の権限(SELECT / INSERT / MODIFY など)
GRANT SELECT ON TABLE ...
GRANT MODIFY ON TABLE ...


PMI(Private Managed Identity)が三層を貫く

Databricksクラスターが Storage にアクセスする際の“主体”は PMI です。

PMI に必要なのは:

  • RBAC → Storage Blob Data Contributor
  • ACL → r-x or rwx
  • Unity Catalog → SELECT / MODIFY

これらが揃わないと、クラスターはデータを操作できません。


よくあるトラブル

  • RBACだけ付けてACLを忘れる(Permission Denied)
  • ACLはOKだがUnity Catalog権限がなくSELECTできない
  • Storage Credential に紐づくIDが誤っている
  • External Location 作成前に RBAC が足りない

すべて「三層モデルのどこか」が欠けているだけです。

まとめると、Databricksの権限トラブルは“三層のどこが欠けているか”を確認するだけで解決できます。


🏁 最後はまとめ:ACLとRBACの違いを理解するとDatabricksアクセスが劇的に安定する

本質は以下の通りです。

  • RBAC=Storageという建物に入る資格
  • ACL=部屋(Directory/File)を操作する実務権限
  • Unity Catalog=論理的にテーブルを操作する権限
  • PMI=三層権限を横断する主体

ADLS Gen2 と Databricks の組み合わせでは、この三層モデルを理解するだけで、アクセスエラーの90%は防げます。

レイクハウスの物理層を理解することが、Databricksを正しく使うための第一歩です。


📚 関連書籍

Databricks/n8n/Salesforce/AI基盤 を体系的に学べる「ゼロから触ってわかった!」シリーズをまとめました。

Databricks

『Databricks──ゼロから触ってわかった!Databricks非公式ガイド』

クラウド時代の分析基盤を “体験的” に学べるベストセラー入門書。
Databricksの操作、SQL/DataFrame、Delta Lakeの基本、ノートブック操作などを
初心者でも迷わず進められる構成で解説しています。
https://www.amazon.co.jp/dp/B0FBGH8PQF

『ゼロから触ってわかった!Azure × Databricksでつくる次世代データ基盤 非公式ガイド ―』

クラウドでデータ基盤を作ろうとすると、Azure・Storage・ネットワーク・権限・セキュリティ…そこに Databricks が加わった瞬間、一気に難易度が跳ね上がります。
「結局どこから理解すればいいの?」
「Private Link むずかしすぎない?」
「Unity Catalog って実務ではどう扱うの?」
——そんな “最初のつまづき” を丁寧にほどいていくのが本書です。
👉 https://amzn.to/4ocWcJI

『Databricks──ゼロから触ってわかった!DatabricksとConfluent(Kafka)連携!非公式ガイド』

Kafkaによるストリーム処理とDatabricksを統合し、リアルタイム分析基盤を構築するハンズオン形式の一冊。
イベント駆動アーキテクチャ、リアルタイムETL、Delta Live Tables連携など、
モダンなデータ基盤の必須スキルがまとめられています。

👉 https://amzn.to/42HdmqZ

『Databricks──ゼロから触ってわかった!AI・機械学習エンジニア基礎 非公式ガイド』

Databricksでの プロンプト設計・RAG構築・モデル管理・ガバナンス を扱うAIエンジニアの入門決定版。
生成AIとデータエンジニアリングの橋渡しに必要な“実務の型”を体系化しています。
資格本ではなく、実務基盤としてAIを運用する力 を育てる内容です。

👉 https://amzn.to/46SutZy

『ゼロから触ってわかった! Snowflake × Databricksでつくる次世代データ基盤 - 比較・共存・連携 非公式ガイド』

SnowflakeとDatabricks――二つのクラウドデータ基盤は、これまで「どちらを選ぶか」で語られることが多くありました。
しかし、実際の現場では「どう共存させるか」「どう連携させるか」が、より重要なテーマになりつつあります。

本書は、両プラットフォームをゼロから触り、構築・運用してきた実体験をもとに、比較・共存・連携のリアルを丁寧に解説する“非公式ガイド”です。

👉 https://amzn.to/4pAONFq

🧠 Advancedシリーズ(上/中/下)

Databricksを “設計・運用する” ための完全版実践書

「ゼロから触ってわかった!Databricks非公式ガイド」の続編として誕生した Advancedシリーズ は、
Databricksを触って慣れた“その先”――本格運用・チーム開発・資格対策・再現性ある設計 に踏み込む構成です。

Databricks Certified Data Engineer Professional(2025年9月改訂版)のカリキュラムをベースに、
設計思考・ガバナンス・コスト最適化・トラブルシュートなど、実務で必須の力を養えます。

📘 [上]開発・デプロイ・品質保証編

👉 https://amzn.to/3LjCDBG

📘 [中]取込・変換・監視・コスト最適化編

👉 https://amzn.to/4oGwkXE

📘 [下]セキュリティ・ガバナンス・トラブルシュート・最適化戦略編

👉 https://amzn.to/433eTYU

n8n

『n8n──ゼロから触ってわかった!AIワークフロー自動化!非公式ガイド』

オープンソースの自動化ツール n8n を “ゼロから手を動かして” 学べる実践ガイド。
プログラミングが苦手な方でも取り組めるよう、画面操作中心のステップ構成で、
業務自動化・AI連携・API統合の基礎がしっかり身につきます。

👉 https://amzn.to/48Blxca

Salesforce

『ゼロから触ってわかった!Salesforce AgentForce + Data Cloud 非公式ガイド』

Salesforceの最新AI基盤 AgentForce と Data Cloud を、実際の操作を通じて理解できる解説書。
エージェント設計、トピック/アクション構築、プロンプトビルダー、RAG(検索拡張生成)など、
2025年以降のAI×CRMのハンズオン知識をまとめた一冊です。

👉 https://amzn.to/3L1TCs7

要件定義(上流工程/モダンデータスタック)

『モダンデータスタック時代の シン・要件定義 クラウド構築大全 ― DWHからCDP、そしてMA / AI連携へ』

クラウド時代の「要件定義」って、どうやって考えればいい?
Databricks・Snowflake・Salesforce・n8nなど、主要サービスを横断しながら“構築の全体像”をやさしく解説!
DWHからCDP、そしてMA/AI連携まで──現場で使える知識をこの一冊で。

👉 https://amzn.to/4pkMwOB

💡 まとめ:このラインナップで“構築者の視点”が身につく

これらの書籍を通じて、
クラウド基盤の理解 → 要件定義 → 分析基盤構築 → 自動化 → AI統合 → 運用最適化
までのモダンデータスタック時代のソリューションアーキテクトとしての全体像を
「体系的」かつ「実践的」に身につけることができます。

  • PoC要件整理
  • データ基盤の要件定義
  • チーム開発/ガバナンス
  • AIワークフロー構築
  • トラブルシュート

など、現場で直面しがちな課題を解決する知識としても活用できます。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?