はじめに
インフォマティカが提供する、 CDGC(データガバナンス&カタログ)では、各種システムからメタデータを取得する(スキャンと言います)ために、予め接続が定義されています。
それらをソース・システムと呼んでおり、2023/10現在では、100種類近くにのぼります。
本ブログでは、それらを一括して確認できるマニュアルページを解説します。
手っ取り早くアクセスしたい場合は、こちらのリンクをクリックしてください。
Informatica Documentation
インフォマティカでは、Informatica Documentationと言うサイトで、マニュアルを提供しており、CDGCやCDMP(データマーケットプレイス)のドキュメント群の閲覧には、無償のユーザー登録(Sign Up)が必要となりますので、ご注意ください。
そこから、Metadata Command Centerを選択してください。
Metadata Command Center
メタデータを取得するなど主に管理者が操作をするMetadata Command Centerですが、このページの①Help for Usersのボタンをクリックし、さらに②Catalog Source Configurationのリンクをクリックしてください。
Catalog Source Configuration
そうすると、ソース・システムの設定を個別に確認できるにページ飛びますが、ここでSource systemsのメニューを選択してください。
ここでは一覧で、どんなソースの接続があり、それぞれどのような機能があるかをテーブル形式で見ることができ、確認と比較が実施しやすいです。
以下、それぞれの列にどのような意味があるかを記載します。
Source System
ソース・システムの名称です。基本的にはDBやファイルシステム単位ですが、一部スクリプトの種類別になっています。
それぞれの名称からリンクが貼られており、ソース・システムの詳細設定を解説するページに飛ぶことができます。
ポータル的な使い方をするのが便利だと考えます。
Connection
どの接続設定を使うかを確認できます。具体的にはIDMCの『管理画面 - 接続』で選択するものを提示しています。
Serverless Runtime Environment
Secure Agentレス(インフォマティカ側のクラウドで提供するSecure Agent相当の機能を利用する形態をServerlessと呼んでいます)で、利用できるかを表しています。
Data Profiling
データプロファイリング(実データの分布・パターン・値の頻度の確認)が実施できるかどうかを表しています。
Data Classification
分類(自動タグ付け機能)が実施できるかどうかを表しています。
Glossary Association
ビジネス用語の自動割当機能が実施できるかどうかを表しています。
DQ Automation
DQ(Data Quality)の取得が実施できるかどうかを表しています。
Advanced Programming Language Parsing
DBやDWHが内包するストアドプロシージャの取得が実施できるかどうかを表しています。
Connection-aware scan
リネージュを取得できるかどうかを表しています。
ただし、BI系(Tableau、Power BI、Qlik)に関してリネージュは取得できるものの、データソースにて、ストアドプロシージャやエイリアスを使用している場合、詳細の情報を取れない制限があるため、このリスト上は『No』になっていますのでご注意ください。基本的にBI系のリネージュは取得可能です。
Relationship Discovery
ソース・システム内のテーブル間の類似カラム等を推論モデルからの発見する事が実施できるかどうかを表しています。