『データマネジメントが30分でわかる本』とは
『データマネジメントが30分でわかる本』は、ゆずたそ氏とはせりょ氏が、プロジェクトマネジメントにおけるPMBOKのデータ管理版、DMBOK(データマネジメント知識体系)を、ご自身の業務経験に照らして要約、事例を加えてわかりやすく解説された本です。
Kindle版と紙版があり、Kindle版はKindle Unlimited対象にもなっていました。(2020/7/19現在)
各知識体系について、具体度を徐々に上げる構成で、網羅的に解説されています。抽象的(30秒コース)を一気に通読するか、ひとつひとつの項目をケーススタディ(3時間コース)まで掘り下げながら進むかは、読者に委ねられています。
- 30秒コース「一言で」
- 3分コース「なにそれ」
- 30分コース「どうして、ゴール、具体的にどうする」
- 3時間コース「ケーススタディ」
著者の経験に基づく解釈が入っているおかげで、抽象化のため、そのままでは読みづらくなりがちな知識体系と比べ、実務の手触りを感じながら読み進めることができます。
先日話題となっていたゆずたそ氏の講演資料(Data Platform Guide - 事業を成長させるデータ基盤を作るには #DataEngineeringStudy / 20200715 - Speaker Deck)がきっかけで、この本を知り、手に取りました。
データマネジメント、DMBOKとは
データマネジメント
引用します。
データマネジメントとは、文字通り、データを管理することです。
ただし、ひとくちに「管理」といってもその内容は幅広いです。主要な業務としては、データを登録・更> 新・活用することが挙げられます。
-- データマネジメントとは何か
以前紹介したメルカリ「機械学習システムの設計パターン」がデータ活用フェーズ、かつ機械学習アプローチとすると、その前におさえておくべきデータ蓄積、整備のために必要な技術、プロセス両面がフレームワークとして整理されています。
DMBOK
DMBOK(Data Management Body of Knowledge)は、業務要件に寄り添い、データ管理の仕組みを定め、継続的に改善していくために何に気をつけたら良いか、をフレームワークとしてまとめて提示してくれています。
DMBOK自体はこんな姿をしています。これを実例を含め読み解いていくと、以下のようになります。
ざっくりまとめ
1回目のざっと通読ですが、自分の2回目以降、あと人と話をするときのため、簡単なサマリを作りました。
この本では、DMBOKの並び順も、整理のため以下のようにフェーズごとに再構成されています。
-
プランニング
- データアーキテクチャ
-
実装・運用(システム編)
- データストレージとオペレーション
- データ統合と相互運用性
-
実装・運用(ロジック編)
- データモデリングとデザイン
- マスターデータ管理
- ドキュメントとコンテンツ管理
-
信頼性(安心の実現)
- データセキュリティ
- データ品質
-
信頼性(便利の実現)
- データウェアハウジングとビジネスインテリジェンス
- メタデータ管理
-
全体指針とルール
- データガバナンス
最後に
以下共にご興味をもたれたら一読をおすすめします。