1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

Databricks on AWS > Oracle DB on RDS 接続時のドライバ設定

Last updated at Posted at 2021-03-29

Databricks から Oracle DB を参照する際のメモです。
ネットワーク設定も終わったしあとはドキュメントにあるとおりやれば大丈夫だろうと思っていたのですが、ドライバのバージョンで詰まったので記しておきます。

Oracle Driver

今回は VAR ファイルを用います。ダウンロードページはこちら。

手元の Databricks クラスタでは Runtime 7.5 を利用していますが、最新バージョンの ojdbc11.jar だと java が対応してないと怒られました。かわりに ojdbc8.jar を用います。以下をダウンロード。

2021-03-30_00h24_15.png

ドライバインストール

管理しやすそうなディレクトリにアップロードします。ドライバ自体は秘匿すべき情報ではないので DBFS 配下でよいでしょう。
2021-03-30_00h28_36.png

ドライバのパスを控えておきます。
2021-03-30_00h29_34.png

Spark API Format をコピー
2021-03-30_00h30_26.png

Cluster > Libraries > Install New > JDBC/S3 > Jar と進み、コピーしたファイルパスを貼り付けて Install をクリック
2021-03-30_00h32_14.png

この状態になれば完了
2021-03-30_00h34_59.png

接続

この状態であればこちらのドキュメントのクエリを叩くことで、Databricks のテーブルと同様にアクセスすることができます。

create_oracle_table
CREATE TABLE oracle_table
USING org.apache.spark.sql.jdbc
OPTIONS (
  dbtable 'table_name',
  driver 'oracle.jdbc.driver.OracleDriver',
  user 'username',
  password 'pasword',
  url 'jdbc:oracle:thin://@<hostname>:1521/<db>')

テーブル化できれば以下のようにクエリ発行可能です。

python
%sql
SELECT * from oracle_table
python
query = "SELECT * from oracle_table"
df = spark.sql(query)

参考 (上記以外)

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?