14
8

はじめに

インフォマティカが提供する、 CDI(Cloud Data Integration)では、トランスフォーメーション(Tx)と呼ばれる変換部品を使って、ノーコードでデータの変換・連携を行うことができます。

この記事では、「共有体」と呼ばれる、複数のパイプラインから1つのパイプラインにデータを統合するために使用するトランスフォーメーションを解説します。

変換部品の概要

共有体

  • 複数の入力グループのデータを1つの出力グループにマージします

図解イメージ

image.png

image.png

変換部品の詳細

データ統合パターンでは、通常、2つ以上のデータソースをすべての行の共有体を含む1つのストリームに組み合わせます。多くの場合、各データソースは同じ構造ではないため、データストリームを自由に結合することはできません。共有体トランスフォーメーションでは、類似するストリームのメタデータを作成し、データソースを1つのターゲットに組み合わせることができます。

共有体トランスフォーメーションはUNION ALL SQL文と同様に、複数のソースのデータを統合します。例えば、共有体トランスフォーメーションを使用して、ADPの従業員情報をWorkday従業員オブジェクトのデータと統合できます。

共有体トランスフォーメーションでデータソースを統合する場合、特定のフィールドを追加、変更、または削除できます。

実行時に、 マッピングタスクは入力グループを並列に処理します。また、共有体トランスフォーメーションに接続されたソースを読み込むと同時に、データブロックをトランスフォーメーションの入力グループにプッシュします。マッピングの実行時に、フィールドマッピングに基づいてデータを1つの出力グループに統合します。

  • ジョイナトランスフォーメーションとの比較
    共有体トランスフォーメーションでは、複数のソースのデータをマージできますが、ジョイナトランスフォーメーションのように結合条件に基づいたデータの結合や重複行の削除は行われません。
    次の表に、複数ソースのデータもマージする共有体トランスフォーメーションとジョイナトランスフォーメーションの重要な相違点を示します。マッピング設計では次の相違点を考慮してください。
要件 共有体トランスフォーメーション ジョイナトランスフォーメーション
重複行を削除する いいえ。共有体トランスフォーメーションからルータートランスフォーメーションまたはフィルタトランスフォーメーションダウンストリームを使用して、重複を削除できます。 はい
結合条件に基づいてレコードを結合する いいえ。共有体トランスフォーメーションは、複数のソースから垂直にデータを結合するSQLのUNION ALL文と同じです。 はい。ジョイナトランスフォーメーションでは、ノーマル結合、右外部結合、左外部結合、完全外部結合がサポートされています。
複数の入力グループを含める はい。複数の入力グループと1つの出力グループを定義できます。 はい。2つの入力グループ(マスタと詳細)を定義できます。
異種ソースを含める ×
異なるデータ型をマージする すべてのソースカラムが類似するデータ型である必要があります。各ソースのカラム数は同じである必要があります。 結合するソースの少なくとも1つのカラムのデータ型が同じである必要があります。
トランザクションを生成する ×

参考文献

トランスフォーメーション マニュアル - 共有体トランスフォーメーション

トランスフォーメーション マニュアル

14
8
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
14
8