概要
データ分析基盤(概念モデル)におけるデータカタログに関する整理を実施します。
本記事にて、下記の記事におけるデータカタログの詳細を記載します。
定義
データカタログの定義
データモデルとData Integration and Interoperability(データ統合と相互運用性)のメタデータに関する、カタログの作成(定義・抽出・蓄積)、および、カタログの利用(探索・把握・共有・配信)によるデータガバナンス支援システム層。
コンポーネント詳細
番号 | データ基盤におけるレイヤー | コンポーネント名 | 説明 | サービス例 |
---|---|---|---|---|
23 | データカタログ | データカタログ | データモデルとData Integration and Interoperability(データ統合と相互運用性)のメタデータに関する、カタログの作成(定義・抽出・蓄積)、および、カタログの利用(探索・把握・共有・配信)によるデータガバナンス支援システム群。 | Informatica Data Catalog、Glue Catalog |
要求要件
データカタログ
下記の機能を保持する必要があります。
番号 | 要否 | 分類 | 主要要件 | 説明 |
---|---|---|---|---|
1 | 必須 | カタログの作成 | カタログの定義 | メタデータを定義する機能 |
2 | 必須 | カタログの作成 | カタログの抽出 | メタデータをシステムから抽出する機能 |
3 | 必須 | カタログの作成 | カタログの蓄積 | メタデータを蓄積する機能 |
4 | 必須 | カタログの利用 | カタログの探索 | メタデータを利用者が探索する機能 |
5 | 必須 | カタログの利用 | カタログの把握 | メタデータを利用者が理解することを支援する機能 |
6 | 必須 | カタログの利用 | カタログの共有 | メタデータを共有する機能 |
7 | 任意 | カタログの利用 | カタログの配信 | メタデータを他システムに配信する機能 |
詳細については、下記の記事を参考にしてください。
参考情報
データカタログ
DMBOK 2ndにて、下記のように紹介されております。
最も一般的な定義である「データに関するデータ」は単純過ぎて誤解を招きやすい。メタデータとして分類できる情報の種類は幅広い。ITプロセスと業務プロセス、データのルールと制約、論理的および物理的なデータ構造、以上に含まれる情報がメタデータに含まれる。メタデータはデータ自体(例えばデータベース、データエレメント、データモデル)、データが象徴する概念(例えば業務プロセス、アプリケーションシステム、ソフトウェアコード、IT基盤)、データと概念の関係性(リレーションシップ)を記述する。
引用元:DMBOK 2nd 第12章 メタデータ管理