この記事は何?
この記事は ちゅらデータ Advent Calender 2021 2日目の記事だよ。
1日目の記事はこちら。
データマネジメントシてますか?って来年は聞いていこうと思っているので、まずはみんなに入門してもらおうと思いこの記事を奏上いたします。
データマネジメントとは
まずはデータマネジメントという用語の定義を知りましょう。
データマネジメント知識体系ガイドには下記のように書かれています。
データマネジメントとは、データとインフォメーションという資産の価値を提供し、管理し、まもり、高めるために、それらのライフサイクルを通して計画、方針、スケジュール、手順などを開発、実施、監督することである。
「データマネジメント知識体系ガイド 第1章 1 イントロダクション」より
要するに、「データから価値を取り出す全てのこと」がデータマネジメントということなんですね。
お?
ということは
データドリブン経営とか、DXとか、ビッグデータとかAIとか、ぜーんぶ、データマネジメントの中に含まれているのでは????
はい、実際そのとおりなんだと思います。
データから価値を得る組織はすべて大なり小なりデータマネジメントに取り組んでるんですね。
だから、データマネジメントの知識体系を抑えることは、とっても重要になるわけです。
データマネジメントの対象者
データマネジメントは、ITスキルと非ITスキルの両方が必要です。
テックとビズのどちらか片方が頑張るだけではデータマネジメントは成せません。
なぜならデータから価値を取り出すにはビジネスや業務のスキルが必須ですし、そもそもデータを提供するにはテックの力が欠かせません。
だから、ITスキルを持ったテックと、非ITスキルを持ったビズの両者が必要になります。
用語整理:データとインフォメーション
ここで整理のために下記の用語の違いを抑えておきましょう。
両者は同じ実体を指す場合がありますが、コンテキストや呼ぶ人間によって名前が変わります。
- データ:事実を観測した値、またはそれを統計化された値、インフォメーションよりテック側の呼び方
- インフォメーション:データにコンテキストがふかされ意味を持った値、データよりビズ側の呼び方
例:売上金額は、単に金額としてみればデータですが、「その金額は売上である」というコンテキストを付与することでインフォメーションと呼べるようになります。
データマネジメントの知識領域
データマネジメントには下記の知識領域カテゴリがあります。
- データガバナンス
- データアーキテクチャ
- データモデリングとデザイン
- データストレージとオペレーション
- データセキュリティ
- データ統合と相互運用性
- ドキュメントとコンテンツ管理
- 参照データとマスターデータ
- データウェアハウジングとビジネスインテリジェンス
- メタデータ管理
- データ品質
基本的にはこれらの知識領域をマスターして、データから価値を引き出し続けような!っていうコンセプトとなっています。
これらの知識領域の中で一つだけ特殊なのが、「データガバナンス」で、他の知識領域の基盤という位置づけです。
知識領域コンテキスト図
データマネジメント知識体系ガイドには、各知識領域には知識領域コンテキスト図と呼ばれる図が定義されており、その領域でどのようなアクティビティがあるのかや、成果物などが定義されています。
アクティビティには「計画」「開発」「運用」「統制」のように、データのライフサイクルを通じた活動が定義されているため、それらのアクティビティを必要に応じて参照するような使い方ができます。
進め方はDMBOKピラミッドを見ると良い
データマネジメント知識体系ガイドには、DMBOKピラミッドという、各知識領域やアクティビティの位置関係を示すピラミッドが紹介されています。
この図に従って、導入するフェーズごとにピラミッドの中心から徐々に知識領域を増やし、データから価値を取り出す高度な機能へ進むように、進め方も示されています。
自分の所属する組織の状況とフェーズを照らし合わせて使うことができて便利です。
データマネジメント原則をいくつか紹介
ここでデータマネジメント原則をいくつか紹介したいと思います。
データの管理はデータ品質の管理
データを管理するってなんだ?と普通は思うのですが、その質問に対する答えはデータ品質の管理と定義されています。
データ品質、すなわち、データが目的に沿っていることを保証することです。
そのためにはステークホルダの要求を理解し、実装し、それが要求に答えているかを計測していく必要があります。
データマネジメントには予め計画が必要
アジャイルなど未知の領域へのアプローチがソフトウェア工学では発展してきておりますが、データマネジメント領域では計画が必要とされます。
なぜかというと、データマネジメントを推進したいはずの組織にはすでに複雑な業務プロセスが走って日々データが生まれているはずだからです。
それらを把握しコーディネートしていくのにはアジャイルな探索的アプローチではなく、既存のドキュメントを把握し、しっかりと計画立てて統合していくSI系の計画する能力が必要となります。
効果的なデータマネジメントにはリーダーのコミットが必要
当たり前ですが、データは統合していくことで価値を増すことになります。そのため政治的にサイロ化されるアーキテクチャや分断されたプロセスなどが残るとその価値をげんじていくことに繋がります。
だから組織のリーダーがそれらの垣根を超えるための後押しをすることが強く要望されるんですね。
まとめ
いかがでしたでしょうか?データマネジメントの触りの概念をかいつまんで紹介しました。
もしまあ機会があれば、各知識領域の部分や、私の好きなSnowflakeだったらここはこう実装して運用できるみたいなそういう話を書こうかなとも思っています。