こちらのコネクターを実際に試してみます。
Databricks SQL Connector for PythonはDatabricksクラスターやDatabricks SQLウェアハウスでSQLコマンドを実行するために、Pythonコードを使用できるPythonライブラリです。pyodbcのようなPythonライブラリと同じように簡単にセットアップ、使用することができます。
要件
準備
以下ではSQLウェアハウスを使用するケースを説明します。
- SQLウェアハウスの接続の詳細でサーバーのホスト名とHTTPパスをコピーしておきます。
- パーソナルアクセストークンをコピーしておきます。
- 開発用マシンで
pip install databricks-sql-connectorを実行してコネクターをインストールします。
コネクターによる接続
-
ターミナルで環境変数を設定します。
Bashexport DATABRICKS_HOST=<Databricksワークスペースのホスト名> export DATABRICKS_HTTP_PATH=<上でコピーしたHTTPパス> export DATABRICKS_TOKEN=<上でコピーしたパーソナルアクセストークン> -
VS Codeを起動します(Python実行環境であれば何でも構いません)。
Bashcode . -
以下のPythonコードを実行します。
Pythonimport os from databricks import sql with sql.connect(server_hostname = os.getenv("DATABRICKS_HOST"), http_path = os.getenv("DATABRICKS_HTTP_PATH"), access_token = os.getenv("DATABRICKS_TOKEN")) as connection: with connection.cursor() as cursor: cursor.execute("SELECT * FROM default.diamonds LIMIT 5") result = cursor.fetchall() for row in result: print(row)
注意
nodename nor servname provided, or not knownやError during request to serverのようなエラーが発生する場合には、環境変数DATABRICKS_HOSTで指定したホスト名にhttps://や末尾の/が含まれていないことを確認してください。
