こちらのコネクターを実際に試してみます。
Databricks SQL Connector for PythonはDatabricksクラスターやDatabricks SQLウェアハウスでSQLコマンドを実行するために、Pythonコードを使用できるPythonライブラリです。pyodbcのようなPythonライブラリと同じように簡単にセットアップ、使用することができます。
要件
準備
以下ではSQLウェアハウスを使用するケースを説明します。
- SQLウェアハウスの接続の詳細でサーバーのホスト名とHTTPパスをコピーしておきます。
- パーソナルアクセストークンをコピーしておきます。
- 開発用マシンで
pip install databricks-sql-connector
を実行してコネクターをインストールします。
コネクターによる接続
-
ターミナルで環境変数を設定します。
Bashexport DATABRICKS_HOST=<Databricksワークスペースのホスト名> export DATABRICKS_HTTP_PATH=<上でコピーしたHTTPパス> export DATABRICKS_TOKEN=<上でコピーしたパーソナルアクセストークン>
-
VS Codeを起動します(Python実行環境であれば何でも構いません)。
Bashcode .
-
以下のPythonコードを実行します。
Pythonimport os from databricks import sql with sql.connect(server_hostname = os.getenv("DATABRICKS_HOST"), http_path = os.getenv("DATABRICKS_HTTP_PATH"), access_token = os.getenv("DATABRICKS_TOKEN")) as connection: with connection.cursor() as cursor: cursor.execute("SELECT * FROM default.diamonds LIMIT 5") result = cursor.fetchall() for row in result: print(row)
注意
nodename nor servname provided, or not known
やError during request to server
のようなエラーが発生する場合には、環境変数DATABRICKS_HOST
で指定したホスト名にhttps://
や末尾の/
が含まれていないことを確認してください。