株式会社NTTデータ Data & Intelligence事業部 の nttd-nagano です。
前回の記事 で、Informaticaのクラウドデータマネージメントプラットフォーム「Intelligent Data Management Cloud」(※1)をご紹介しましたが、今回は、そのIDMCのデータ統合サービスである「Cloud Data Integration」(※2)と、同社の旧来のデータ統合製品である「PowerCenter」を比べ、その違いをまとめてみました。
記事が長くなってしまったため、全4回に分割してご説明します。
今回は第1回目として「まとめのまとめ」「差異の概要」「コンポーネントレベルでの比較」をご説明します。
※1. 略称はIDMC。旧称はIICS。以下IDMCと記載。
※2. 以下CDIと記載。
「データ統合」というのは、ETL(※3)と呼ばれていたこともある領域の処理です。
※3. Extract、Transform、Loadの頭文字を取った言葉。これらはそれぞれ、連携元からのデータ抽出、データの変換・加工、連携先へのデータのロードを示します。
なお、IDMCにはCDIをはじめ様々なサービスがありますが、本記事はPowerCenterとの比較であるため、CDIのみにフォーカスしてご説明していきます。
まとめのまとめ
-
コンポーネントレベルで比較すると、下表のような対応関係になります。
PowerCenterのコンポーネント IDMCのCDIのコンポーネント クライアントツール - Repository Manager
- PowerCenter Designer
- Workflow Manager
- Workflow Monitor
Informatica Cloud Services コアサービス - Log Service
- Configuration Service
- Gateway Service
- Authentication Service
- Administration Service
- Domain Service
同上 Repository Database 同上 PowerCenter Integration Service Informatica Secure Agent -
データ統合の定義体レベルで比較すると、下表のような対応関係になります。
PowerCenterの定義体 IDMCのCDIの定義体 ワークフロー タスクフロー セッション マッピングタスク マッピング マッピング マップレット マップレット
差異の概要
公式の動画「IICS for PowerCenter Developers: How to Navigate IICS」 をベースに筆者の解釈を交えて説明します。
- PowerCenterはクライアント/サーバーベースの製品でした。一方、CDIはネイティブクラウドサービスです。
- PowerCenterで開発する際には、PCにクライアントツールをインストールしておく必要がありました。一方、CDIで開発する際に使うのはウェブブラウザのみです。
- PowerCenterのクライアントツールでログインする際にはPowerCenterリポジトリに対してログインしていました。一方、CDIでは各ログインはOrganization(略称:Org)に対してログインすることになります。
- CDIにログインすると、まず、アプリケーションピッカーが表示されます。PowerCenterのRepository ManagerやInformatica Administratorでやっていたような管理者作業は、CDIでは、アプリケーションピッカーで「管理者」をクリックすると表示される「管理者」画面にておこないます。
- PowerCenterの「マッピング」に相当する定義体は、CDIでも「マッピング」です。マッピングの詳細は 公式ドキュメント をご覧ください。
- CDIの「マッピング」を作るためには、アプリケーションピッカーにて「データ統合」をクリックし、「新規」>「マッピング」をクリックします。すると、マッピングデザイナーが表示されます。これはPowerCenter Designerに非常に近いものです。
- CDIのマッピングデザイナーの左側にトランスフォーメーション一覧が表示されています。PowerCenterで慣れ親しんだトランスフォーメーションの他に、CDIには新しいトランスフォーメーションもあります。
- PowerCenterでは、トランスフォーメーション内に「ポート」があり、他のトランスフォーメーションの「ポート」と接続していました。一方、CDIのトランスフォーメーションには「ポート」という概念がありません。「フィールドルール」と「フィールドマッピング」にて接続します。
- PowerCenterでの「セッション」に相当する定義体は、CDIでは「マッピングタスク」です。
- PowerCenterでは、「セッション」を作るのにクライアントツールをWorkflow Managerに切り替える必要がありました。一方、CDIの「マッピングタスク」を作るためには、マッピングキャンバスのままで、画面左で「新規」>「マッピングタスク」をクリックすると作れます。
- PowerCenterの「ワークフロー」に相当する定義体は、CDIでは「タスクフロー」です。
- CDIでは、マッピングデザイナーのままで、画面左で「新規」>「タスクフロー」をクリックすると作れます。
- PowerCenterでは、実行結果を確認するためにWorkflow Managerを使用していました。一方、CDIでは画面左の「マイジョブ」をクリックすると実行結果を確認できます。
- PowerCenterでは、マッピングにおいてパラメーターファイルを使用することができました。一方、CDIでも、パラメータファイルを使用することができます。
- PowerCenterでは、マッピングやワークフローをコマンドで実行できました。一方、CDIでも、タスクやタスクフローをコマンドで実行できます。
- PowerCenterでは、チームベース開発オプションを購入している場合、バージョン管理ができました。一方、CDIではデフォルトで、「GitHub」または「Azure DevOps Git」によるバージョン管理に対応しています。
- PowerCenterでは、リポジトリ内のオブジェクトをファイルにエクスポート/インポートできました。一方、CDIでもCloud Servicesのリポジトリ内のアセットをファイルにエクスポート/インポートできます。
- PowerCenterでは、アップグレードしたい場合、サポートを通じてアップグレードリクエストを作成する必要がありました。そして、ソフトウェアをインストールする必要がありました。一方、CDIでは、アップグレードは自動的に開始します。
コンポーネントレベルでの比較
公式の動画「PowerCenter to IICS Basics - Component Architecture」をベースに筆者の解釈を交えて説明します。
- PowerCenterのクライアントツール(Repository Manager、PowerCenter Designer、Workflow Manager、Workflow Monitor)は、各開発者のPCにインストールされたファットなソフトウェアでした。開発者はそれらを使い、メタデータを作成し、そのメタデータはRDB上のリポジトリデータベースに格納されていました。実行時にはPowerCenter Intergration Serviceがメタデータを解釈し、統合タスクを実行していました。この他に、ドメインレベルでホストされているコアサービス(Log Service、Configuration Service、Gateway Service、Authentication Service、Administration Service、Domain Service)がありました。
- 一方、CDIには2つの主要なコンポーネントがあります。Informatica Cloud ServicesとInformatica Secure Agentです。 Cloud Servicesはマルチテナントメタデータリポジトリであり、リポジトリの管理とメンテナンスはInformaticaがおこないます。アップグレードもInformaticaがおこないます。Cloud Servicesは開発用のブラウザUIも提供します。 実行時にはSecure Agentが統合タスクを実行します。 Secure Agentも自動的にセルフアップデートされます。
- CDIのSecure Agentはクラウドにもオンプレにデプロイできます。あるいは完全にInformaticaのネットワーク上のマシンにホストされたAgentを使うこともできます。
- CDIのSecure Agentは、Cloud Servicesからメタデータを取得し、連携元(ソース)や連携先(ターゲット)と実データをやり取りして処理します。(通常のSecure Agentでは、実データはCloud Services側に送信されない。 他のAgentでは送信されることもある )
- CDIのコンポーネントの詳細は、「Informatica’s Intelligent Data Management Cloud - Security Architecture Overview」をご覧ください。
おわりに
以上、「PowerCenterとCDIの違いをまとめてみた」の第1回目でした。
次回の第2回目は、「ソースやターゲットの設定の比較」「トランスフォーメーションの種類や使用方法の比較」「トランスフォーメーション間の接続の方法の比較」をご説明します。
※.2022.12.20追記:第2回目を投稿しました。 → Informatica PowerCenterとCloud Data Integrationの違いをまとめてみた(第2回/全4回)
IDMCのCDIは30日間の無料体験ができる ので、この機会に試してみてはいかがでしょうか。
IDMCには今回ご紹介したCDIの他にも、API統合、マスターデータ管理、データガバナンス関連など様々なサービスがあります。
これらについても、今後、当Organization の記事でご紹介していく予定ですので、ご興味がございましたらご覧ください。
仲間募集中!
NTTデータ Data&Intelligence事業部 では、以下の職種を募集しています。
1. 「クラウド技術を活用したデータ分析プラットフォームの開発・構築(ITアーキテクト/クラウドエンジニア)」の募集
クラウド/プラットフォーム技術の知見に基づき、ITアーキテクトまたはPMとして、DWH、BI、ETL領域における、ソリューション開発の推進や、コンサルティング工程のシステムグランドデザイン策定時におけるアーキテクト観点からの検討を行う人材を募集しています。2. AI/データ活用を実践する「クラウド・ソリューションアーキテクト」
AI/データ活用を実践する「クラウド・ソリューションアーキテクト」として、クラウド先進テクノロジーを積極活用し、お客様のビジネス価値創出活動を実践。AI/データ活用の基本構想立案コンサルティングからクラウドプラットフォーム提供・活用を支援しています。お客様のAI・データ活用を支援するクラウド・ソリューション提案、アーキテクチャ設計・構築・継続活用支援(フルマネージドサービス提供)、および最新クラウドサービスに関する調査・検証で、クラウド分析基盤ソリューションのメニュー拡充を実施する人材を募集します。また、取り扱う主なソリューションについては、以下のページも参照ください。
ソリューション紹介
1. NTTデータとInformaticaについて
データ連携や処理方式を専門領域として10年以上取り組んできたプロ集団であるNTTデータは、データマネジメント領域でグローバルでの高い評価を得ているInformatica社とパートナーシップを結び、サービス強化を推進しています。2. Trusted Data Foundationについて
~データ資産を分析活用するための環境をオールインワンで提供するソリューション~https://enterprise-aiiot.nttdata.com/tdf/
最新のクラウド技術を採用して弊社が独自に設計したリファレンスアーキテクチャ(Datalake+DWH+AI/BI)を顧客要件に合わせてカスタマイズして提供します。
可視化、機械学習、DeepLearningなどデータ資産を分析活用するための環境がオールインワンで用意されており、これまでとは別次元の量と質のデータを用いてアジリティ高くDX推進を実現できます。