DMBOK2からマスタデータ管理をちょっとずつ理解する
DMBOK2をベースにマスタデータ管理(MDM)について理解していきたいと思います。
あくまでざっくり、ちょっとずつを念頭にしています。また、詳細についてはDMBOK2の原本をご確認ください。
そもそもDMBOKとは?
DAMAという団体が作成している「データマネジメント知識体系」=「データ管理に関していい感じの方法の集合体」のこと。
ちなみ、DAMAはデータに関するすごい人たちが集まっている団体。
情報処理技術者試験でしばしば登場するPMBOK(プロジェクトマネジメント知識体系)のデータ管理版のようなイメージ。
書籍としては、いまのところ第2版まで出版されていて、第2版のことをDMBOK2と呼んでいます。
DMBOK2は英語版で1万円程度、日本語版は2万2000円程度(Amazon)。
けちって筆者は英語版を買いました。
DMBOK2ではデータマネジメントについて11個の要素が定義されていますが、マスタデータ管理の部分だけをちょっとずつ理解していくのが今回の趣旨です。
(※正確にはマスタデータ管理だけではなくリファレンスデータ管理も一緒に述べられています。違いについてはそのうち書きます...たぶん)
マスタデータとは?
いろいろなシステムやプロセス、ビジネスをまたがって利用されるデータのことです。
例えば「顧客情報」「製品情報」「従業員情報」などです。
<例>顧客情報 - マスタデータ
顧客番号 | 顧客名 | 住所 | 産業 |
---|---|---|---|
001 | XXX株式会社 | 東京都XX区YY町 | 製造業 |
マスターデータに対応するデータがトランザクションデータです。
具体的には「Aという顧客が製品Xをn個買った」というような情報です。
<例>購入情報 - トランザクションデータ
顧客番号 | 購入製品番号 | 数量(個) | 合計販売価格(円) | 取引日 |
---|---|---|---|---|
001 | PC-100 | 10 | 700,000 | 2020/05/12 |
さて、本題のDMBOK2ではマスタデータは次のように書かれています(筆者訳)。
組織内で、ビジネス・プロセス・システムをまたいで必要とされるデータのこと。
マスタデータ管理
では、マスタデータ管理(MDM)とは何でしょうか。
この問いは言い換えるのであれば次のようになります。
ビジネス・プロセス・システムをまたいでマスタデータを使用できるとどんな良いことがあるか?
DMBOK2では以下のメリットが示されています。
データの冗長性/品質のリスク・データ統合のコストを減らすことができる
この状態であれば管理対象のマスタデータのメンテナンスをすることで、使用しているどのシステムでもその恩恵を受けることができます。
また、個々のシステムを横ぐしで見る、同じマスタデータを別々で手入れする必要もなくなりコストを削減することが可能になります。
これを目指すために組織は「マスタデータを共有できる仕掛けづくり」・「データの高品質化」・「モデルや統合方法の標準化」等を行っていくことになります。
次回は「企業が達成しようとする目標(ビジネスドライバ)」等を細かく見ていきたいと思います。
参考
DAMA-DMBOK: Data Management Body of Knowledge: 2nd Edition(2017/7/1発行)