データマネジメント知識体系(DMBOK)の独自要約とケーススタディ集 ということで、データ管理のための仕組みについての入門書。 クラウド寄りのインフラエンジニアの自分は、データ周りは環境を作っておしまいのことが多く、運用もサーバだったりサービスだったり、下回りのため、データ管理について、なぜ、どのように、を実践的に説明してくれる本書はわかりやすかったのでお勧めです。
章立ては以下のとおり。
【01:データアーキテクチャ】
【02:データストレージとオペレーション(DB)】
【03:データ統合と相互運用性(ETL)】
【04:データモデリングとデザイン(ER)】
【05:マスターデータ管理】
【06:ドキュメントとコンテンツ管理】
【07:データセキュリティ】
【08:データ品質管理】
【09:データウェアハウジング(DWH)とビジネスインテリジェンス(BI)】
【10:メタデータ管理】
【11:データガバナンス】
各章ごとに30秒コース、3分コース、30分コース、3時間コースがあるので、30秒コースをよんで2分考えるであれば、たしかに30分で終わりますが、記憶にのこらないので、全部じっくり読むとよいです。自分は隙間時間にちまちま読み1週間、15時間ほどかかりました(参考リンク等はみる時間はなかったです)。
出版が2020/3と2年前になります。当然古い部分があるのですが、クラウド系の技術より陳腐化する部分が少ないと感じました。また、A/Bテストの話や、評価をふくめたサイクルをまわすことで、システムの陳腐化を防ぐ仕組みについて記載しているのも実践的なシステムをつくってきた人が書いてるなという感想です。一度全部読んで、後で実際の問題にはまったら見直す、という使い方もありです。
あとがきの
「場当たり対応、そろそろやめませんか?」
という部分もよい話でした。心抉られますが。
欠点といっていいのか目的外というか、網羅的ではないです。amazonのレビューの指摘もありましたし、著者自身もDMBOKの内容と整合的ではないと書いています。DMBOKの本の厚さをかんがえれば、まぁ当然ですよね。
また、大きな組織だとデータに関連して組織の問題がでてきそうですが、その部分も比較的簡易にかかれていると感じました。この部分、データ管理システムもコンウェイの法則に従うという理解です。
まとめると、データ管理にかかわる人のとっかかりとしては非常に優秀なので読もうね、です。
ではでは。