はじめに
インフォマティカが提供する、 CDGC(データガバナンス&カタログ)を使って、Microsoft Sharepoint Onlineからメタデータを取得(スキャン)するためのガイドです。
Sharepoint Onlineのメタデータを取得するための全体的な流れは下図の通りです。
前提条件
メタ情報抽出権限:
1.Microsoft SharePoint Online アカウントに接続し、Microsoft SharePoint Online アプリケーションにアクセスできること。
2.Microsoft SharePoint Online コネクタを設定すること。
3.サイトおよびそのコンテンツ(サブサイトやドキュメント ライブラリなど)への読み取り権限を付与すること。
接続作成
Sharepointの接続は事前に作成する必要があり、少しAzure側の作業や確認が必要となりますので、詳細はInformatica IDMC上にSharepoint Online接続を作成の記事をご覧ください。
カタログソースを作る
これからカタログソースを設定します。
カタログソースからMicrosoft Sharepoint Onlineを選択します。
全般情報にジョブ名前を入れて、接続リストから事前に作成されたSharepoint Onlineの接続を選択して、接続をテストします。画面上に「テスト成功しました」のメッセージが出てきたら、問題なく接続できたのことです。
次、メタデータ抽出設定を行います。
ランタイム環境は自社のSecure Agentを選択します。
メタデータ変更オプションでメタデータの変更を保持するか削除するかを選択します。
メタデータの抽出範囲に対してフィルターかけることが可能です。
データ分類がAIエンジンが自動的にやって欲しいであれば、データ分類の設定に入って、ボタンをオンにすればOKです。
今回は最小限の設定で行きたいので、省略します。
他の設定は必須ではないため、このまま保存して、実行しましょう。実行完了しましたら、データガバナンス&カタログの画面にて結果をチェックしましょう。
まとめ
Informaticaのカタログ製品は非常にシンプルな設定だけでメタデータを自動抽出できますので、ぜひ一度お試しください。
また、Informaticaカタログの他の機能について興味がございましたら、コメントをお願いします。