はじめに
インフォマティカが提供する、 CDGC (データガバナンスとデータカタログ)を使って、Oracle からメタデータを取得(スキャン)するためのガイドです。2023/08 時点の情報を元にしています。
事前準備
CDGC がセットアップ済みであり、メタデータコマンドセンターのメニューにアクセスできるライセンス、およびユーザロール、ユーザであることを確認してください。こちらのナレッジベースより手順をご確認ください。
前提
メタデータの抽出
以下の権限を割り当てたユーザーを準備します。必要に応じて Oracle 管理者の方とご相談ください。
- Oracle データベースへのアクセスに使用するデータベースユーザーアカウントに CONNECT 権限を付与します。
- 以下のいずれかの方法で SELECT 権限を付与します。
- 事前定義の SELECT_CATALOG_ROLE ロールを付与します。
- 次の権限を付与します:
- select on SYS.DBA_ARGUMENTS
- select on SYS.DBA_COL_COMMENTS
- select on SYS.DBA_COLL_TYPES
- select on SYS.DBA_CONS_COLUMNS
- select on SYS.DBA_CONSTRAINTS
- select on SYS.DBA_DB_LINKS
- select on SYS.DBA_DIRECTORIES
- select on SYS.DBA_EXTERNAL_LOCATIONS
- select on SYS.DBA_EXTERNAL_TABLES
- select on SYS.DBA_MVIEWS
- select on SYS.DBA_OBJECTS
- select on SYS.DBA_OPBINDINGS
- select on SYS.DBA_SEQUENCES
- select on SYS.DBA_SOURCE
- select on SYS.DBA_SYNONYMS
- select on SYS.DBA_TAB_COLUMNS
- select on SYS.DBA_TAB_COMMENTS
- select on SYS.DBA_TABLES
- select on SYS.DBA_TRIGGERS
- select on SYS.DBA_TYPE_ATTRS
- select on SYS.DBA_USERS
- select on SYS.DBA_VIEWS
- select on SYS.NLS_SESSION_PARAMETERS
データプロファイリング
Oracle でデータプロファイリングを実行するには、プロファイリングするテーブルとビューに SELECT 権限を付与します。
スキャン対象
Oracle から下記のメタデータを取得可能です。
- データベース
- スキーマ
- テーブル
- ビュー
- カラム
- ストアドプロシージャ
- 関数
- パッケージ
また、以下のSQL 機能も使用可能です:
- 静的 SQL
- PL/SQL
- パラメータ・トレース付きのプロシージャー・コール
- メタテーブル付きの動的SQL
以下の Oracle オブジェクトに対してデータプロファイリングを実行できます:
- テーブル
- ビュー
接続設定
CDGC でソースシステムからからメタデータを抽出するには前提にあるようなソース毎の要件を満たしたユーザーで接続を作成する必要があります
接続の作成に関しては、ナレッジベース(KB) の手順もご確認ください
接続を作成する際に Secure Agent を指定する必要があります。もし、まだインストールされていない方はナレッジベース (KB) の手順を参考に Secure Agent をインストールしてください。
スキャン設定
詳細のステップは、マニュアル、How to Library も合わせて参照してください。
4.Oracle への接続情報を選択し「次へ」をクリックします
必要に応じて、「テスト接続」にて、正常に接続できることを確認してください
5.ランタイム接続から利用する Secure Agent を選択、必要に応じてフィルタによる絞り込みを実施します。メタデータ変更オプションは今回は「削除」を選択します。
メタデータ変更オプションのチェック項目の日本語訳が正しくなく、修正予定がまだ先になりますので簡単に補足しておきます。この設定は既にカタログに取り込まれたアセットがソースシステム側で削除された場合にどう処理されるかを決定します。それぞれの設定に対して以下の様な動作となります。
オプション | 動作 |
---|---|
保持 | カタログソースからオブジェクトが削除されたり、フィルタ条件の変更でオブジェクトがヒットしなくなった場合でも、既にカタログ内に存在する変更前のアセットはカタログに保持されます。 |
削除 | カタログソースからオブジェクトが削除された場合及びフィルタ条件の変更でオブジェクトがヒットしない場合、メタデータがカタログから削除されます。 |
つまり、過去に一度でもアセットとして存在していたら残したい、という場合には「保持」を設定する必要がありますが、現在の最新のデータベース側の最新状態、フィルタ条件に応じたアセットを抽出、検索したい場合、「削除」を設定します。
6.データプロファイリングの設定
データプロファイリングを設定して、Oracle ソースシステムから抽出されたメタデータに対してプロファイルを実行します。
「データプロファイリングとデータ品質」タブをクリックし、データプロファイリングの右側の矢印をクリックします。
必要に応じて、任意のパラメータ設定を実施します。ランタイム接続の選択とパラメータを設定し、保存をクリックします。
「署名と値を保持」で、値の頻度と呼ばれる実データのサマリを取得できます。プロファイリングスコープを「完全」にすることでメタデータの変更の有無に関わらず、プロファイリングが実施されます。
7.「関連付け」「スケジュール」は必要に応じて設定しますが、今回はすぐにスキャンを実施したいため、「保存」をクリックし、「実行」をクリックします。
9.ジョブ監視画面に自動で遷移するので、しばらく待ってステータスが完了になったことを確認します。
結果の確認
- 取得したアセットの一覧を表示
CDGC の画面から、該当のカタログリソースが閲覧できることを確認します。
- データプロファイリングの結果を表示
テーブルのカラムを選択して、プロファイリングの結果を確認します。
この例は電話番号データで、パターンや値の頻度の情報から、データの形式やそのデータが全体に占める割合などを確認できます。
Tips
- 処理に失敗する場合、ナレッジベース(KB)を参照し、エラーメッセージから検索を実施してください。
- プロファイリングで日本語などのマルチバイト文字が化けてしまう場合、こちらのナレッジベース の手順をお試しください。