概要
Azure Databricksから、ADLS gen2ストレージにあるデータを取得する手順について確認したいと思います。
ここでは、最初のADLSgen2ストレージの作成方法について確認したいと思います。
Azure ADLS gen2の作成
ストレージアカウントの作成 (Azure Portal)
まずはADLSのストレージコンテナを作成するため、ストレージアカウントを作成します。
データブリックス・ワークスペース内でのみ利用するの場合、Azure Databricksと同じリソースグループを指定しておくと管理が楽になります。Azure リソースグループについてはこちらの記事が参考になりました。
- サブスクリプション/リソースグループ 上図の管理スコープを参考に既存のものを選択するか、新規作成をします。
- ストレージアカウント名・地域 を選択します。
-
パフォーマンス は
Standard
で十分です。 -
冗長性 もデフォルトの
GRS
にします。
次に進み詳細設定
では、階層型名前空間を有効にする
にチェックを入れます。これによりADLSgen2のファイルレベルアクセスが可能になります。
残りの設定は全てデフォルトのままでストレージアカウントを作成
します。
コンテナの作成 (Azure Portal)
ストレージアカウントが作成出来たら、次にコンテナを作成します。コンテナが具体的なストレージオブジェクトとして、Notebookからアクセスする対象となります。
ストレージブラウザー
- BLOBコンテナ
を選択します
作成したコンテナ上にサンプルデータをアップロードしておきます。(後ほどロードするため)
サンプルcsvデータ
ここまでが共通のADLSストレージ作成作業になります。
データブリックスからストレージへのアクセス方法
ストレージが作成できたら、認証方式を決めて設定をします。各認証方式の特徴と設定方法はこちらをご覧ください。