2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

DatabricksのVolumesを活用してクイックに分析

Posted at

先日リリースされたVolumesを活用すると、任意のフォーマットのファイルをお手軽に分析できるようになります。

ボリュームとは

簡単に言えば、Unity Catalogにマウントされるファイルシステムのようなものです。

ボリュームは、クラウドオブジェクトストレージロケーションのストレージの論理的ボリュームを表現するUnity Catalogのオブジェクトです。ボリュームは、ファイルのアクセス、格納、制御、整理する能力を提供します。テーブルは表形式のデータセットに対するガバナンスを提供しますが、ボリュームは非テーブルケー式のデータセットに対するガバナンスを追加します。構造化、半構造化、非構造化データを含むすべてのフォーマットのファイルの格納、アクセスを行うためにボリュームを活用することができます。

ボリュームへのファイルのアップロード

以下で公開されているCSVをダウンロードします。

あえてここではExcelで保存します。
Screenshot 2023-07-31 at 10.58.56.png

Databricksのデータエクスプローラにアクセスし、必要に応じてスキーマを作成し、その配下にボリュームを作成します。
Screenshot 2023-07-31 at 11.00.11.png
Screenshot 2023-07-31 at 11.00.37.png
Screenshot 2023-07-31 at 11.00.50.png

このボリュームにアップロードをクリックします。
Screenshot 2023-07-31 at 11.02.03.png

先ほどのExcelファイルをドラッグ&ドロップします。
Screenshot 2023-07-31 at 11.03.46.png

アップロードをクリックします。Excelがアップロードされました。
Screenshot 2023-07-31 at 11.04.48.png

ボリュームのファイルへのアクセス

ボリュームのファイルには/Volumes/takaakiyayoi_catalog/exterenal_data/external_filesのパスでアクセスできるようになります。

display(dbutils.fs.ls("/Volumes/takaakiyayoi_catalog/exterenal_data/external_files"))

Screenshot 2023-07-31 at 11.15.43.png

pandasを使ってロードしてみます。

最初に必要なライブラリをインストールします。

%pip install openpyxl xlrd
dbutils.library.restartPython()

ボリュームのパスを指定してロードします。

import pandas as pd

pdf = pd.read_excel("/Volumes/takaakiyayoi_catalog/exterenal_data/external_files/newly_confirmed_cases_daily.xlsx")
display(pdf)

読み込めました!
Screenshot 2023-07-31 at 11.20.18.png

ボリュームによって、ファイルシステムの複雑性が抽象化されるので、お手軽にファイルを活用した分析ができるようになると思います。ぜひご活用ください!

Databricksクイックスタートガイド

Databricksクイックスタートガイド

Databricks無料トライアル

Databricks無料トライアル

2
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?