概要
Azure Data Factory の メタデータ駆動のコピータスクにて Ingest Timestamp の Hive スタイルのパーティションの値(例:ngest_timestamp=2024-06-05 02%3A46%3A50
)を設定する方法を共有します。MetadataDrivenCopyTask_xxx_BottomLevel
パイプラインにおけるFullLoadOneObject
アクティビティと'DeltaLoadOneObject'アクティビティにて、cw_folderPath
パラメータの設定値を下記のように修正することで対応できます。
@Concat(
json(item().SinkObjectSettings).folderPath
,'/'
,'ingest_timestamp'
,'='
,formatDateTime(
utcnow()
,'yyyy-MM-dd HH'
),
'%3A'
,formatDateTime(
utcnow()
,'mm'
),
'%3A'
,formatDateTime(
utcnow()
,'ss'
)
)
パイプライン実行後にtest01/ingest_timestamp=2024-06-05 02%3A46%3A50
のようなディレクトリにファイルが書き込まれます。
手順
1. Azure Data Factory にてメタデータ駆動のコピーアクティビティのパイプラインを構築
2. MetadataDrivenCopyTask_xxx_BottomLevel
パイプラインを表示後にFullLoadOneObject
アクティビティと'DeltaLoadOneObject'アクティビティにのcw_folderPath
パラメータを修正
@Concat(
json(item().SinkObjectSettings).folderPath
,'/'
,'ingest_timestamp'
,'='
,formatDateTime(
utcnow()
,'yyyy-MM-dd HH'
),
'%3A'
,formatDateTime(
utcnow()
,'mm'
),
'%3A'
,formatDateTime(
utcnow()
,'ss'
)
)