0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

[OCI]DBMS_CLOUDパッケージに追加されたクラウド・ストレージ内のファイルの一括操作(コピー/移動/削除)機能を試してみた

Last updated at Posted at 2022-11-02

はじめに

DBMS_CLOUDパッケージに、クラウド・ストレージ上にあるファイルの一括操作を行うための以下のプロシージャが追加されました。

  • DBMS_CLOUD.BULK_COPY
  • DBMS_CLOUD.BULK_MOVE
  • DBMS_CLOUD.BULK_DOWNLOAD
  • DBMS_CLOUD.BULK_UPLOAD
  • DBMS_CLOUD.BULK_DELETE

ということで、早速検証してみました。

こちらのプロシージャを使用すると、
・クラウド・ストレージ(バケット)からのデータロード終了後に、ファイルを別のクラウド・ストレージ(バケット)に移動する
・クラウド・ストレージ(バケット)からのデータロード終了後に、バケット内のファイル全て削除する
・OCI以外のクラウド・ストレージからOCI Object Storageへのデータの移動を、サーバやローカルストレージを介さずに行える

といったことが簡単に行えるようになります。

こちらの検証では、OCI Object Storageのアクセスにリソース・プリンシパル、Amazon S3のアクセスにARNを用いたロールベースの認証を使用しています。
それぞれの設定方法の詳細は、以下のマニュアルおよび記事をご参照ください。

  • リソース・プリンシパル

  • AWS ARNを用いたロールベースの認証

1. DBMS_CLOUD.BULK_COPYプロシージャ

DBMS_CLOUD.BULK_COPYプロシージャを使用して、Object Storageのバケット間でデータをコピーしてみます。

コピー元となるSourceBucketというバケットを作成し、以下の5つのファイルをアップロードしました。
testdata1.txt
testdata2.txt
testdata3.txt
testdata4.txt
testdata5.txt
スクリーンショット 2022-11-02 11.02.26.png

スクリーンショット 2022-11-02 11.02.33.png

また、コピー先となるTargetBucketというバケットを作成しました。
スクリーンショット 2022-11-02 11.02.10.png

では、早速DBMS_CLOUD.BULK_COPYプロシージャを実行して、SourceBucket内にあるファイルを一括でTargetBucket内にコピーしてみます。

Object Storageバケット間でファイルのコピーを行うには、source_credential_nameにクレデンシャル、source_location_uriにコピー元となるバケット、target_location_uriにコピー先となるバケットを指定して、DBMS_CLOUD.BULK_COPYを実行します。

SQL> BEGIN 
  2  	DBMS_CLOUD.BULK_COPY (
  3  		source_credential_name => 'OCI$RESOURCE_PRINCIPAL',
  4  		source_location_uri    => 'https://objectstorage.ap-tokyo-1.oraclecloud.com/n/nrhnlrqdttaw/b/SourceBucket/o',
  5  		target_location_uri    => 'https://objectstorage.ap-tokyo-1.oraclecloud.com/n/nrhnlrqdttaw/b/TargetBucket/o'
  6  	);
  7  END;
  8  /

PL/SQLプロシージャが正常に完了しました。

SQL>

TargetBucketの内容を確認します。
「他のアクション」から「リフレッシュ」をクリックして、表示内容を更新します。
スクリーンショット 2022-11-02 11.03.57.png
5つのファイルがコピー元に指定したSourceBucketからコピーされていることが確認できました。
スクリーンショット 2022-11-02 11.04.28.png

2. DBMS_CLOUD.BULK_DELETEプロシージャ

次に、DBMS_CLOUD.BULK_DELETEプロシージャを利用して、バケット内のファイルを一括で削除してみます。

Object Storageバケット内のファイルの一括削除を行うには、credential_nameにクレデンシャル、location_uriに対象を指定して、DBMS_CLOUD.BULK_DELETEを実行します。
ここでは、TargetBucketを指定して実行してみます。

SQL> BEGIN
  2  DBMS_CLOUD.BULK_DELETE (
  3       credential_name => 'OCI$RESOURCE_PRINCIPAL',
  4       location_uri    => 'https://objectstorage.ap-tokyo-1.oraclecloud.com/n/nrhnlrqdttaw/b/TargetBucket/o'
  5  );
  6  END;
  7  /

PL/SQLプロシージャが正常に完了しました。

SQL>

TargetBucketの詳細ページで、「他のアクション」から「リフレッシュ」をクリックします。
スクリーンショット 2022-11-02 11.07.43.png

TargetBucket内の全てのファイルが削除されていることが確認できました。
スクリーンショット 2022-11-02 11.08.05.png

3. DBMS_CLOUD.BULK_MOVEプロシージャ

DBMS_CLOUD.BULK_MOVEプロシージャを使用して、Object Storageのバケット間でデータを移動してみます。

Object Storageバケット間でファイルの移動を行うには、source_credential_nameにクレデンシャル、source_location_uriに移動元となるバケット、target_location_uriに移動先となるバケットを指定して、DBMS_CLOUD.BULK_MOVEを実行します。

では、早速DBMS_CLOUD.BULK_MOVEプロシージャを実行して、SourceBucket内にあるファイルを一括でTargetBucket内に移動してみます。

SQL> BEGIN
  2  DBMS_CLOUD.BULK_MOVE (
  3  	source_credential_name => 'OCI$RESOURCE_PRINCIPAL',
  4  	source_location_uri    => 'https://objectstorage.ap-tokyo-1.oraclecloud.com/n/nrhnlrqdttaw/b/SourceBucket/o',
  5  	target_location_uri    => 'https://objectstorage.ap-tokyo-1.oraclecloud.com/n/nrhnlrqdttaw/b/TargetBucket/o'
  6  );
  7  END;
  8  /

PL/SQLプロシージャが正常に完了しました。

SQL>

TargetBucketの内のファイルを確認してみます。
TargetBucketの詳細ページで、「他のアクション」から「リフレッシュ」をクリックします。
スクリーンショット 2022-11-02 11.14.08.png
SourceBucketにあった5つのファイルがあることが確認できました。
スクリーンショット 2022-11-02 11.14.32.png

次に、SourceBucketの内のファイルを確認してみます。
SourceBucketの詳細ページで、「他のアクション」から「リフレッシュ」をクリックします。
スクリーンショット 2022-11-02 11.07.43.png
SourceBucketにあった5つのファイルがTargetBucketに移動していることが確認できました。
スクリーンショット 2022-11-02 11.15.28.png

4. DBMS_CLOUD.BULK_COPYプロシージャによる異なるクラウド・ストレージ間でのファイルのコピー

DBMS_CLOUDパッケージは、OCI Object Storage以外のクラウド・ストレージも操作対象にすることが可能です。

OCI Object StorageのTaargetBucketからAWS S3のmy-s3-bucket-for-adbにファイルを一括コピーしてみます。

コピー元となるクラウド・ストレージにアクセスするためのクレデンシャルをsource_credential_nameに、コピー先となるクラウド・ストレージにアクセスするためのクレデンシャルをtarget_credential_nameに設定します。
また、コピー元となるバケットをsource_location_uri に、コピー先となるバケットをtarget_location_uriに指定して、DBMS_CLOUD.BULK_COPYを実行します。

では、早速DBMS_CLOUD.BULK_COPYプロシージャを実行して、 OCI Object StorageのバケットTargetBucket内にあるファイルを一括でAWS S3のバケットmy-s3-bucket-for-adb内にコピーしてみます。

SQL> BEGIN
  2  DBMS_CLOUD.BULK_COPY (
  3  	source_credential_name => 'OCI$RESOURCE_PRINCIPAL',
  4  	target_credential_name => 'AWS_S3_CRED',
  5  	source_location_uri    => 'https://objectstorage.ap-tokyo-1.oraclecloud.com/n/nrhnlrqdttaw/b/TargetBucket/o',
  6  	target_location_uri    => 'https://my-s3-bucket-for-adb.s3.ap-northeast-1.amazonaws.com/'
  7  );
  8  END;
  9  /

PL/SQLプロシージャが正常に完了しました。

SQL> 

バケットmy-s3-bucket-for-adbのオブジェクトのタブを表示します。
更新ボタンをクリックして、表示内容を更新します。
スクリーンショット 2022-11-02 11.39.26.png
OCI Object StorageのバケットSourceBucket内にあるファイルが一括でAWS S3のバケットmy-s3-bucket-for-adb内にコピーされたことが確認できました。
スクリーンショット 2022-11-02 11.43.43.png

5. DBMS_CLOUD.BULK_MOVEプロシージャによる異なるクラウド・ストレージ間でのファイルの移動

最後に、AWS S3のバケットmy-s3-bucket-for-adbにあるファイルをOCI Object StorageのバケットSourceBucketに一括で移動してみます。

SQL> BEGIN
  2  DBMS_CLOUD.BULK_MOVE (
  3  	source_credential_name => 'AWS_S3_CRED',
  4  	target_credential_name => 'OCI$RESOURCE_PRINCIPAL',
  5  	source_location_uri    => 'https://my-s3-bucket-for-adb.s3.ap-northeast-1.amazonaws.com/',
  6  	target_location_uri    => 'https://objectstorage.ap-tokyo-1.oraclecloud.com/n/nrhnlrqdttaw/b/SourceBucket/o'
  7  );
  8  END;
  9  /

PL/SQLプロシージャが正常に完了しました。

SQL> 

バケットmy-s3-bucket-for-adbのオブジェクトのタブを表示します。
更新ボタンをクリックして、表示内容を更新します。
スクリーンショット 2022-11-02 11.43.43.png
バケットmy-s3-bucket-for-adb内から全てのファイルがなくなっていることが確認できました。
スクリーンショット 2022-11-02 11.48.25.png
SourceBucketの詳細ページで、「他のアクション」から「リフレッシュ」をクリックします。
スクリーンショット 2022-11-02 11.49.20.png
S3バケットmy-s3-bucket-for-adb内の全てのファイルが、Object StorageのバケットSourceBucketに移動されていることが確認できました。
スクリーンショット 2022-11-02 11.49.31.png

まとめ

DBMS_CLOUDパッケージを使用して、クラウド・ストレージ内のファイルの一括操作(コピー/移動/削除)ができることが確認できました。

実際には、処理の並列度を制御したり、正規表現を使用してバケット内の一部のファイルのみを処理の対象とするといったことも可能なので、今後いろいろと試してみたいと思います。

参考資料

Using Oracle Autonomous Database on Shared Exadata Infrastructure:Bulk Operations for Files in the Cloud

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?