#やりたいこと
下図のように、赤線のデータのみ取得したい。
ここで取り込みファイルのキー項目は氏名とする。
#作成したパッケージ
全体図は下図のようになる。制御フローはデータフロータスクのみ。
##各グループの役割について説明
###行番号設定
まず、取り込みファイルからどの行が何行目か分からないので、派生列、スクリプトコンポーネントより先頭から順に数字を設定する。
###同一キー(名前)で最小の行番号データのみ取得
ここからが本番。
ファイルの各行をキー(名前)でグループ化して行番号が最小の値を取得する。
それをファイルのグループ化前と行番号でくっつけて完成!
余談)各並び替えタスクはマージ結合タスクで必要なので適当に設定してください!
#まとめ
並び替えタスクで重複を排除できるようなチェックボックスがあったんですが、どの行を排除するまでは指定できなかったので、このような処理を書きました。
#感想
また、この方法を知るまでは一時表を使ってSQLで書こうとしましたが、一時表とトランザクションの設定がうまくいかず、断念しました。。。難しい。