はじめに
インフォマティカが提供する、 CDGC(データガバナンス&カタログ)にて、2023年11月にリリースされた内容について記載します。
※2023/11時点の情報を元にしています。
個人的なオススメは、「Informatica QuickLookブラウザ拡張機能」「IDMC metadata」「用語集のアセットとデータ要素およびデータ・エンティティの分類との関連付け」です!
別記事にて、個別機能の詳細も解説している(していきたい)ので、ぜひご覧下さい!
2023年11月リリースとは
年に3回実施される、新機能を含むリリースとなります。
リリースの詳細は、こちらのマニュアルを御覧ください。
リリースノートの見方
ドキュメントページにおいて、11月のWhat's New in IDMC
Data Governance and Quality Cloud関連ドキュメントにおいて、Release Notes、What's New - November 2023がそれぞれ掲示されています。
本記事では、下記の3つの章から、トピックを抜粋して、ご紹介します。
重要なお知らせ(Important notices)
ドキュメントは、こちら。
下記のスキャナー、機能がPreviewから正式リリースに格上げされました。
- Apache Atlas
- AWS Glue
- Microsoft Purview
- Microsoft Excelファイルからメタデータを抽出
下記の新規スキャナー、新機能はPreview(ベータ版)扱いとなります。
- IDMC metadata
- Oracle Cloud Infrastructure GoldenGate catalog source
Previewの機能は評価目的でサポートされていますが、本番環境または本番環境への移行を予定している環境ではサポートされていません。Informatica は、本番環境向けの次期リリースにプレビュー機能を含める予定ですが、市場や技術状況の変化に応じて、プレビュー機能を含めない場合もあります。
アップグレード後のタスク
下記において、アップグレード後にタスクが必要となるので、詳細はマニュアルを御覧ください
- SAP BusinessObjects
- IDERA ER/Studio Data Architect
- Microsoft Azure Synapse
新機能と機能強化(New features and enhancements)
ドキュメントは、こちら。
新しいカタログ・ソース
- Oracle Business Intelligence
- Oracle Cloud Infrastructure GoldenGate(プレビュー)
- Qlik Sense Cloud
- TIBCO Spotfire
強化されたカタログ・ソース
強化内容の詳細は、ドキュメントを参照してください。
- Amazon Athena
- Apache Atlas
- Databricks
- File System
- Google BigQuery
- Microsoft Power BI
- Salesforce
- SAP BusinessObjects
カスタムワークフローの構成
カスタム ワークフローを使用すると、Application Integration で複数ステップの承認プロセスを設計できます。Application Integration で組織のニーズに合ったプロセスを作成することができます。
カタログソースのクローン
- 既存のカタログソースと類似したカタログソースを作成するには、カタログソースのクローンを作成してカタログソースのコピーを作成し、必要に応じて構成を変更します。
- デフォルトでは、クローンされたカタログ・ソースの名前には接尾辞 "_copy" が含まれます。カタログソースの名前は変更できます。
- クローン作成では、カタログソースの構成はコピーされますが、抽出されたメタデータはコピーされません。
階層構造の表示
階層ファイルからグループまたはリーフ要素を抽出する事ができます。
AVRO、Parquet、XML、XSDのファイル タイプの階層ファイルからグループ要素を抽出できます:
REST API
カタログ・ソース管理 REST API を使用して、指定した機能を持つカタログ・ソース・ジョブを実行できます。
Shift-JIS でエンコードされたファイルのインポート
ルックアップテーブルを作成するときに、UTF-8 に加えて Shift-JIS でエンコードされたファイルをインポートできます。
メタデータ抽出のフィルタの追加
特定のアセット タイプに基づくメタデータ抽出フィルタを定義できます
例)テーブル、ビュー、ストアドプロシージャ、外部テーブル等アセットタイプごとに定義されています。
アセットレイアウトのカスタマイズ
Metadata Command Centerでは、アセットタイプごとにアセットページやプレビューペインのレイアウトをカスタマイズできるようになりました。この機能により、組織内のさまざまな部門のニーズに基づいて、さまざまなアセット タイプのカスタム レイアウトを作成できます。
Informatica QuickLookブラウザ拡張機能
Google Chrome 用のブラウザ拡張機能で、任意の Web ページ上のテキストをシームレスに検索し、カタログ内の対応するアセットを見つけることもできます。
新しいアセットタイプ
ビジネスエリア、規制、プロジェクト、地理、リーガルエンティティが追加されました。
用語集のアセットとデータ要素およびデータ・エンティティの分類との関連付け
用語集のメトリクスおよび用語集のビジネス用語をデータ要素およびデータ・エンティティ分類に関連付けることができるようになりました
複数の入力パラメータを持つデータ品質ルール仕様への技術ルール参照の追加
データ品質で、複数の入力パラメータを含むルール仕様のルールオカレンスを作成できるようになりました。
子アセットへのステークホルダーの割り当て
技術アセットに関係者を割り当てる事ができるようになり、また親アセットの子アセットに関係者を自動割り当てることができるようになりました。
例)テーブルに関係者を割り当てると、その配下のカラム群にも関係者が自動的に割り当たります。
ユーザー グループ内の関係者の表示
関係者にユーザーグループを割り当てる事ができるようになりました。
ビジネス アセットとテクニカル アセットのデータ リネージ ビューの改善
「すべてのホップを展開」のメニューが追加され、操作性が向上しました。
データ品質ルール発生のためのプライマリおよびセカンダリデータ要素の一括インポート
バルク・インポート・テンプレート・ファイルを使用して、プライマリおよびセカンダリ・データ要素をデータ品質ルール・オカレンスに関連付けることができます。
データ要素の分類の指定を「なし」に設定可能
技術アセットの詳細が追加された検索結果のエクスポート
検索結果をエクスポートする際、[アセット詳細を含む] チェックボックスを選択すると、ダウンロードした Microsoft Excel ファイルの別シートにアセット詳細がエクスポートされます。
変更された動作(Changed behavior)
ドキュメントは、こちら.
-
Apache Atlas カタログソースの Kerberos デバッグログを有効にするエキスパートパラメータの追加
デバッグログファイルを有効にするエキスパートパラメータを追加できるようになりました。 -
Microsoft Azure Data Factory カタログソース用の Databricks カタログプリロードフィルタ
テーブルやビューなどの Databricks カタログアセットをプリロードするためのインクルードおよび除外フィルタを構成できるようになりました。 -
Microsoft Power BI 接続オブジェクト
Administrator で Microsoft Power BI 接続オブジェクトを使用して、ソースシステムに接続できるようになりました。 -
定義済みワークフロー
定義済みワークフローが、Administrator でバンドルとして利用できるようになりました。これらのバンドルをダウンロードして、Application Integration にプロセスとしてインポートできます。 -
フィルタ条件でのワイルドカード
次のカタログ ソースのメタデータ抽出フィルタを作成するときに、ワイルドカードを含めることができます:
Microsoft Azure Data Lake Storage Gen2
Amazon S3