はじめに
インフォマティカが提供する、 CDI(Cloud Data Integration)では、トランスフォーメーション(Tx)と呼ばれる変換部品を使って、ノーコードでデータの変換・連携を行うことができます。
この記事では、「ジョイナ」と呼ばれる、2つの関連する異種ソースからのデータを結合するトランスフォーメーションを解説します。
変換部品の概要
ジョイナ
- 2つの異なるソースからのデータを結合します
次の結合タイプを使用できます。
- Normalジョイン
結合条件に一致する行が含まれます。結合条件に一致しない行は破棄されます。 - マスタ外部
明細パイプラインのすべての行およびマスタパイプラインの一致する行が含まれます。一致しないマスタパイプラインの行は破棄されます。 - 明細外部
マスタパイプラインのすべての行および明細パイプラインの一致する行が含まれます。一致しない明細パイプラインの行は破棄されます。 - 完全外部
結合条件に一致する行およびマスタパイプラインと明細パイプラインのすべての入力データが含まれます。
図解イメージ
変換部品の詳細
ジョイナトランスフォーメーションは、2つの関連する異種ソースからのデータを結合できます。例えば、ジョイナトランスフォーメーションを使用して、Salesforceの取引先オブジェクトのデータが含まれるフラットファイルから取引先情報を結合できます。
ジョイナトランスフォーメーションは、結合条件および結合タイプに基づいてデータを結合できます。結合条件では、2つのソース間でフィールドを照合します。複数の結合条件を作成できます。結合タイプでは、結果に含まれるデータセットを定義します。
トランスフォーメーションをジョイナトランスフォーメーションにリンクする場合、トランスフォーメーションをマスタグループまたは明細グループにリンクします。ジョブのパフォーマンスを高めるには、小さいデータセットを表すトランスフォーメーションをマスタグループに接続します。
マッピング内の3つ以上のソースを結合する場合は、複数のジョイナトランスフォーメーションを使用できます。ジョイナトランスフォーメーションからの出力を別のソースパイプラインと結合できます。すべてのソースパイプラインを結合するまで、ジョイナトランスフォーメーションをマッピングに追加できます。
一致するフィールド名があるソースを結合する場合、フィールド名の競合が発生する可能性があります。競合は次のいずれかの方法で解決できます。
- フィールド名の競合の解決を作成する。
- アップストリームトランスフォーメーションの一致するフィールドの名前を変更する。
- 式トランスフォーメーションを介してデータを渡し、フィールドの名前を変更する。