More than 3 years have passed since last update.

[Oracle Cloud] Data Integration で Parameter を使い、入力と出力を柔軟に指定する

Last updated at 2020-09-19Posted at 2020-09-19

はじめに

前回の Data Integration チュートリアルでは、Object Storage に格納されているファイルを読み取り、加工して、ADW に格納をしました。このデータ加工フローでは、Input に使う Object Storage のファイル名や、出力先の ADW は固定されています。特に、Input に使う Object Storage のファイルは、データ加工の度に好きなファイルを指定したくなります。こういうときに使えるのが、Parameter の指定です。入力ファイル名や出力ファイル名をパラメータ化して、好きな名前を指定できます。

それでは Parameter の指定方法を紹介します。

事前準備 : テストデータと、Data Flow の作成

Object Storage の input と output バケットに、csv テストデータを格納します。

paramtest01.csv

name,id,userrank
sugiyama,1,bronze
tanaka,2,gold
suzukii,3,silver

paramtest02.csv

name,id,userrank
satou,4,bronze
kimura,5,gold
takahashi,6,silver

次に、Data Integration でデータ加工を行う Data Flow を準備します。Object Storage の input Bucket から、csv ファイルを受け取り、データ加工を行い、output Bucket に出力する内容です。

Input の指定

Data Tab で、リアルタイムにデータを確認できます。

Filter の指定

userrank の値が、silver のデータのみフィルターを行います。

FILTER_1.SOURCE_1.userrank='silver'

Data タブでリアルタイムにデータを確認できます
silver のみフィルターされています。

CREATE NEW ENTITY を入れて、Select を押します

こんな感じで、出力先の Object Storage を指定します。NEW DIRECTORY NAME は、出力するディレクトリの名前です。後からパラメータ化しますが、動作確認のために指定した名前は憶えておきましょう。

この段階で、作成した Data Flow を実行してみると、次のように Bucket にデータ加工されます。

ディレクトリ名は、指定した parametertest01 が作成されています。その下に格納されている part-00000-37a3bc9a-31dc-491e-a521-4ae4c44b1b63-c000.csv の中身は、Filter で設定したように、silver でフィルターされています。