LoginSignup
0
0

More than 1 year has passed since last update.

Databricks からAzure Data Lake Storageへの接続手順 (ADLS gen2 Storageの作成)

Last updated at Posted at 2021-12-23

概要

Azure Databricksから、ADLS gen2ストレージにあるデータを取得する手順について確認したいと思います。
ここでは、最初のADLSgen2ストレージの作成方法について確認したいと思います。

Azure ADLS gen2の作成

ストレージアカウントの作成 (Azure Portal)

まずはADLSのストレージコンテナを作成するため、ストレージアカウントを作成します。
image.png

データブリックス・ワークスペース内でのみ利用するの場合、Azure Databricksと同じリソースグループを指定しておくと管理が楽になります。Azure リソースグループについてはこちらの記事が参考になりました。

image.png

  • サブスクリプション/リソースグループ 上図の管理スコープを参考に既存のものを選択するか、新規作成をします。
  • ストレージアカウント名・地域 を選択します。
  • パフォーマンスStandardで十分です。
  • 冗長性 もデフォルトのGRSにします。

image.png

次に進み詳細設定では、階層型名前空間を有効にするにチェックを入れます。これによりADLSgen2のファイルレベルアクセスが可能になります。

残りの設定は全てデフォルトのままでストレージアカウントを作成します。

コンテナの作成 (Azure Portal)

ストレージアカウントが作成出来たら、次にコンテナを作成します。コンテナが具体的なストレージオブジェクトとして、Notebookからアクセスする対象となります。
ストレージブラウザー - BLOBコンテナを選択します

image.png

コンテナーを追加する にて、新規作成します。
image.png

作成したコンテナ上にサンプルデータをアップロードしておきます。(後ほどロードするため)
サンプルcsvデータ
image.png

ここまでが共通のADLSストレージ作成作業になります。

データブリックスからストレージへのアクセス方法

ストレージが作成できたら、認証方式を決めて設定をします。各認証方式の特徴と設定方法はこちらをご覧ください。

ストレージアカウント認証
SAS Token認証
サービスプリンシパル認証

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0