2023 年 4 月のアップデートによる変更点 (2023/03/31 更新)
2023 年 4 月のアップデートにより、ファイルストアパブリケーションリポジトリ使用時のファイル取り込みタスクの作成方法が変更されます。具体的には、パブリケーションのターゲットおよびサブスクリプションのソースで、下記で案内しているように「ローカルフォルダ」を指定するのではなく、「Cloud Integration Hub」を選択するようになります。
既存のファイル取り込みタスクとそれを使用したパブリケーション/サブスクリプションは変更せずにそのまま使用できますが、タスクの編集を行う場合には、そのタイミングで接続を「Cloud Integration Hub」に変更する必要があります。
この記事は インフォマティカ Advent Calendar 2022 Day 19 の記事として書かれています。
はじめに
2022 年 10 月のアップデートにより、Cloud Hub Integration (以下 CIH) にファイルストアパブリケーションリポジトリの機能が追加されました。
これにより、オンプレミスの Data Integration Hub で広くご使用いただいているファイルパススルーのように、CIH でもパブリケーションとサブスクリプションでファイルをそのまま扱うことができるようになりました。
この記事では実際にファイルストアパブリケーションリポジトリを使用したパブリケーションとサブスクリプションを作成してみます。
ファイルストアパブリケーションリポジトリの有効化
まず最初にファイルストアパブリケーションを有効化します。
Informatica Intelligent Cloud Services へログインし、マイサービス画面から「統合ハブ」を選択し、ホーム画面右上の「セットアップ」をクリックします。
セットアップ画面下部に「ファイルストアパブリケーションリポジトリ」という欄が追加されています。
「ファイルストアの有効化」にチェックを行い、「ファイルストアリポジトリの場所」として、ファイルを格納するフォルダへのパスを指定します。Secure Agent がアクセス可能な場所を指定する必要があります。
タスクを作る
通常の CIH のパブリケーションやサブスクリプションでは、データの移送部分は Cloud Data Integration のマッピングタスクを使用しますが、ファイルストアパブリケーションリポジトリを使用する場合にはファイル取り込みタスクを使用します(つまり、セキュアエージェントグループで Mass Ingestion - Files のサービスを有効化する必要があります)。
注意点はマニュアルの「ファイル取り込みタスクのルールとガイドライン」に記載がありますが、まとめると下記です。
- パブリケーション/サブスクリプション共通
① スケジュールは「このタスクはスケジュールを使用しない」に設定する
② 「ファイルの安定性を確認」を選択しない - パブリケーション
③ ターゲットの接続タイプは「ローカルフォルダ」を指定する
④ ターゲットディレクトリは、パラメータ \${$PMTargetFileDir} を指定する - サブスクリプション
⑤ ソースの接続タイプは「ローカルフォルダ」を指定し、ファイルリストによるファイルピックアップを行う
⑥ ソースディレクトリは、パラメータ \${$PMSourceFileDir} を指定する
⑦ ファイルリストにダミーの文字列を指定する
パブリケーション
マイサービスで「一括取り込み」を選択し、ファイル取り込みタスクを新規作成します。
取り込み元となるソースの設定を行います。
今回は Google Cloud Storage からファイルを取得します。バケットには、名前が「src」から始まるファイルと「tgt」から始まるファイルがそれぞれ 10 づつアップロードされています。
パブリッシュするファイルのパターンの指定により、「src」から始まる名前のファイルのみ移送するよう指定してみます。また、「ファイルの安定性を確認」はデフォルトの未チェックの状態のままにします。
続いてターゲットを指定します。Secure Agent がファイルストアパブリケーションリポジトリとして指定したフォルダへ書き込むための設定として、「接続タイプ」は「ローカルフォルダ」、「ターゲットディレクトリ」は「\${$PMTargetFileDir}]を指定します。
「スケジュールの詳細」では、デフォルトの「このタスクはスケジュールどおりに実行しない」のままにし、タスクを保存します。
サブスクリプション
サブスクリプション用のファイル一括タスクはソースの指定でいろいろとコツがあります。
接続タイプはパブリケーションのソースと同じく「ローカルフォルダ」を指定します。ファイルのピックアップ方法はファイルリストですが、「ファイルリスト」の入力フィールドではダミーの値を設定します。また、ソースディレクトリも、パブリケーションのターゲットディレクトリと同じようにパラメータ「\${$PMSourceFileDir}」を指定します。
ターゲットは Advanced SFTP V2 コネクタを使用して Linux マシンにファイルを置くことにします。
ランタイムオプションでスケジュール設定にしない点はパブリケーションと同様です。
CIH のアセットを作る
タスクを作成したので、続いて CIH のアセットを作成します。
まずはトピックです。「パブリケーションリポジトリタイプ」で「ファイルストア」を指定します。
続いてパブリケーションを作成します。
「パブリケーション方法」で「ファイル取り込みタスクでファイルをパブリッシュ」、「トピック」では上記で作成したファイルストア用のトピックを指定します。「ファイル取り込みタスクでファイルをパブリッシュ」を選択すると、「タスク」のリストには一括取り込みタスクが表示されるので、そこからタスクを選択します。
サブスクリプションも同じように「コンシューム方法」で「ファイル取り込みタスクでファイルをコンシューム」、「タスク」でサブスクリプション用に作成したタスクを指定します。
実行
一括取り込みのジョブ画面でも、タスクが実行されたことがわかります。
パブリケーションにより、ファイルストアパブリケーションリポジトリにどのようにファイルが配置されたかを見てみます。
下記のような階層になっていることがわかります。
① 「ファイルストアリポジトリの場所」で指定したパス
② 組織ID
③ トピック名
④ 実行日(YYYYMMDD)
⑤ イベントID
また、ファイルパターンで指定した通り「src」から始まる名前のファイルのみが移送されていることがわかります。
続いてサブスクリプションを実行します。
サブスクリプションでは、上記④の実行日以降のフォルダ構造が維持された状態でファイルが移送されます。
おわりに
タスク作成時にいくつかのポイントはありますが、それらをおさえれば簡単に CIH でファイルを扱う処理を作成できます。ファイルストアパブリケーションリポジトリを是非ご利用ください。