##はじめに
私はインフォマティカで、データマネジメントの価値や必要性を多くの人に伝えることをミッションとして活動しています。
そこでこの記事では、難しい専門用語を使わずにデータマネジメントについて解説してみたいと思います。
この記事を読んだ人が、データマネジメントとは何もので、どこを目指すべきものなのか、を理解できれば嬉しく思います。
##データマネジメントとは何か?
データマネジメントとは、ストレートに言えば、データを管理することです。
ただデータを管理すると聞いても、「どのように管理するの?」と思う人も多いのではないかと思います。
そこで私は以下のように伝えるようにしています。
データマネジメントとは、「データをビジネスに利活用できる状態にすること」
そして、「ビジネスに利活用できる状態」について、以下のように補足しています。
あらゆるシステムのデータが繋がり、
データの信頼性が確保できていて、
あらゆる人が簡単にデータへアクセスできる状態
これは逆説的に想像いただけるとわかりやすいです。
以下の状態にあるデータは、お世辞にも管理されてるとは言えないもので、ビジネスに利活用できない、価値へと繋がらないのは想像に易いと思います。
各種システムのデータがバラバラで、複数のデータを繋げて利活用できない。
データの中身に抜け漏れや誤りが多く、データの信頼性がない。
データを入手する方法が難しくて、誰もデータへアクセスできない。
そして、これらのデータマネジメントが目指すべきゴールは、データを利活用することではありません。
利活用によって、売上や利益の向上といったようなビジネス上の価値を得ることがゴールとなります。
データマネジメントのゴールとは、「データからビジネス上の価値を得ること」
このデータマネジメントについて、次の章ではもう少し踏み込んで解説したいと思います。
##水のマネジメントについて理解する
データマネジメントの定義についてご紹介しましたが、具体的に何をすれば良いのか、まだ腹落ちしてないと思います。
そこで、水を例にして、データマネジメントの世界でやるべきことを理解していきたいと思います。
水は、人が生きる上で無くてはならない貴重なものです。
私たち日本人は、いつでもどこでも蛇口を捻れば、すぐに安全な水を得ることができます。
水を飲んで喉を潤すこともできるし、水をお風呂に入れて沸かして疲れを癒すこともできます。
このように我々が水から価値を簡単に得ることができるのは、水が国によって正しくマネジメントされているからです。
では、水のマネジメントってどのように行われているのか、ここから一緒に考えてみましょう。
水の始まりって何だろうと考えると、、、雨からスタートすると考えることができます。
雨が降ると、そこに含まれる水は河川に流れます。
そして、いくつもの河川を繋げた貯水池に貯まることになります。
但し、貯水池に貯められた水、原水はそのまま飲むことはできません。
原水中に含まれる汚れを取り除き、消毒して、綺麗にする浄水場が必要です。
綺麗になった水は、配水池に届けられて確保されます。
配水池に確保された水は、家の蛇口を捻るだけで、水の使用量の変化等にかかわらず、いつでも必要な時に誰もが水を利用することができます。
そして、水をとりまく一連の工程は、誰もが継続的に安全な水を享受できるように、全て水道局によって統制されている必要があります。
水量は不足してないか、国が定める水質基準を満たしているか、水道管に故障は発生してないか、どこで誰にどの程度水が消費されているのか。
全体を俯瞰して常時監視を行い、問題があれば、その地域の責任を持った作業員へ連絡し、素早く問題を解決します。
以上が、水のマネジメントの概要です。
この水で行われているマネジメントを、全てデータに置き換えてみると、データマネジメントに必要な仕組みやアクティビティが見えてきます。
##水を例にして、データマネジメントについて理解する
水と同様にデータも、雨のような、何かしらの業務や仕組みを通じて生み出されます。
生み出されたデータは、システムに保管されます。
これらのデータは各システムで保管しているだけでは、分析などのその他の目的で利活用することはできません。
そこで、いくつものシステムを繋ぎ、データの貯水池(データレイク)へデータを貯めることが必要です。
更に、各業務専用で生み出されたデータ、原データには品質の低いデータも含まれているため、**データを綺麗にまとめる浄水場(マスタデータ管理)**が必要です。
データの浄水場では、データを会社統一の標準化された品質へクレンジングしたり、データの重複を排除して、会社全体でまとめて利用できる綺麗な統一されたデータを手に入れます。
特に、個別システムでサイロ化されたデータをまとめて、業務横断で利活用できる状態にするためにはこの工程は欠かせません。
綺麗になったデータは、**データの配水池(データウェアハウス、データマート)**に届けられて確保されます。
配水池に確保されたデータは、取り扱いやすい形式で格納し、カタログで可視化することで、いつでも必要な時に誰もがデータを発見して利用することができます。
そして、データをとりまく一連の工程は、誰もが継続的に安全にデータを利活用できるように、全てデータガバナンスチームによって統制されている必要があります。
必要なデータは揃っているか、国が定める規制や契約に違反していないか、データ品質に問題はないか、データの流れに障害は発生してないか、どこで誰にどの程度データが消費されているのか。
全体を俯瞰して常時監視を行い、問題があれば、その地域の責任を持ったデータのオーナーへ連絡し、素早く問題を解決します。
##まとめ
以上が、データマネジメントとして具体的にやるべき活動であり、備えるべき仕組みです。
なるべく専門用語を使わずに説明してみましたが、何となく腹落ちできましたでしょうか。
AIや機械学習、その他BI(Business Intelligence)ツールと呼ばれるような便利なデータ分析ツールは、全てデータを入力にして機能します。
データをマネジメントして、クリーンなデータをそれらのツールに渡すことができなければ、正しく機能しないばかりか、腹痛のような問題を起こすことになりかねません。
従って、腹痛を起こさないためにも、データマネジメントの活動においては、以下を実践してデータをビジネスに利活用できる状態にすることが必要です。
あらゆるシステムのデータが繋がり、(データの貯水池へデータを貯める)
データの信頼性が確保できていて、(データの浄水場でデータを綺麗にする)
あらゆる人が簡単にデータへアクセスできる状態(データの配水池からデータを提供する、且つ、水道局でデータを統制する)
皆さまが、今回の記事を楽しんでいただき、今後データマネジメントに取り組むきっかけとなれば幸いです。
##(おまけ)データマネジメントの10の要素
過去、別の記事にてデータマネジメントで必要となる要素を、今回より細かく10個の「データをxxする」で解説したこともあります。
これはその時に描いたイメージです。
##(おまけ)データマネジメントの一般的な定義
最後に、データマネジメントに関する参考情報を共有します。
データ管理のWikiにはこう定義されています。
データ管理(データかんり、英語: Data Management、データマネジメント)とは、データを管理する活動のことを指す。データをビジネスに活かすことができる状態で継続的に維持、さらに進化させていくための組織的な営み[1]、データを「経営戦略を決定する上での重要な資産」と捉え、意思決定のために常時利用可能な状態に改善・維持すること[2]である。
また、米国DAMAインターナショナルが編纂した、データマネジメントに関する知識体系のバイブル、DMBOKにはこう定義されています。
データマネジメントとは、データ資産を計画的に作成・統制・配信するための組織的機能で、ビジネスとしての側面とIT(データベース技術)としての側面を持つ。DAMAでは「データと情報資産の価値を獲得し、統制し、保護し、提供し、向上させるために行うポリシー、実践、およびプロジェクトを計画し、実行し、監視する活動である。