Connect to Databricks from Microsoft Excel | Databricks on AWS [2023/6/1]の翻訳です。
本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。
本書では、Microsoft ExcelからDatabricksに接続するためにどのようにDatabricks ODBCドライバーを使用するのかを説明します。接続を確立すると、ExcelからDatabricksのデータにアクセスできるようになります。また、さらにデータを分析するためにExcelを活用することができます。
準備
- ワークスペースを作成します。
- Databricksクラスターを作成し、クラスターを用いて関連データを作成します。Databricksで初めてのETLワークロードを実行するをご覧ください。
- お使いのOSの64-bitバージョンのODBCドライバーをダウンロードします。
- ODBCドライバーをインストール、設定します(Windows | MacOS | Linux)。このセットアップでは、DatabricksとMicrosoft Excelを接続するために使用するデータソース名(DSN)のセットアップを行います。
- トークン管理API。
- Microsoft Excelのインストール。トライアルバージョンを使用することもできます。
Microsoft Excelから接続するステップ
このセクションでは、準備ステップで作成したDSNを用いて、どのようにDatabricksからMicrosoft Excelにデータを取り出すのかを説明します。
注意
このセクションのステップは、Excel for Microsoft 365 for Mac version 16.70を用いてテストされました。
- Microsoft Excelで空のワークブックを開きます。
- Dataリボンで、Get Data (Power Query) の隣の下向きキャレットをクリックし、From database (Microsoft Query) をクリックします。
- ODBC Data Source Chooserで、準備ステップで作成したDSNを選択し、OKをクリックします。
-
Usernameには
token
を入力します。 - Passwordでは、準備ステップで取得したパーソナルアクセストークンを入力します。
- Microsoft Queryダイアログでは、ExcelにロードしたいDatabricksのテーブルを選択し、Return Dataをクリックします。
- Import Dataダイアログでは、TableとExisting sheetを選択し、Importをクリックします。
Excelワークブックにデータをロードした後は、そのデータに対する分析オペレーションを実行することができます。