みなさん、こんにちは!
今日は「データ統合」という言葉について少し掘り下げてみたいと思います。
この記事のタイトル「データを統合するということの意味」には実は2つのことが隠れています。1つ目は「データを統合する」という言葉の定義はどういったものなのか?ということ、2つ目は「データを統合するとどんないいことがあるの?」という結果に関する意味になります。
それではまず言葉の定義からお話ししましょう。
「データを統合する」とは?
「データを統合する」という言葉を聞いてみなさんはどのようなことを連想するでしょうか?
データが発生する場所は実に様々です。社内にある業務用のシステムであったり、IoTによって発生するセンサーデータであったり、SaaSシステムによって作られるデータなど、社内外のありとあらゆる場所でデータは生まれます。データの利用者がそれらを利用したいと思ったときどうすればいいでしょう?
対象のデータを集める
もっとも原始的な方法は、データ利用者自身が様々なシステムからせっせとデータを集めることです。それぞれのシステムの管理者にメールを書きデータを抽出してもらう、あるいは利用者自身でたくさんの種類のシステムにアクセスし抽出することもあるでしょう。このようにデータを利用者のローカル環境に集め分析に使用するということができます。でもこれはデータ利用者に大変な労力を要求します。データが集まったころにはもうそのデータを分析する気力もなくなるほどに…
データレイクを作ってみよう
それではそのようなデータを1か所に集めたレイクを作ってみましょう。
データ利用者はデータをせっせと集めてくる必要はなくなりました。レイクにアクセスすることで必要なあらゆるデータを得ることができるようになったようです。
これでデータ利用者が抱えていた問題はすべて解決、喜んでいるはずですね!
っと、おやっ?データ利用者はまだ頭を抱えて必死に作業をしています。どういうことでしょう?データ利用者は何をしているのでしょうか?
データを集めるだけでは足りないこと
そう、利用者は集められたデータから必要なデータを抜き出したあと、様々な発生源から得たデータを正しくコラボレーションするためにデータの調整・加工をしていたのです。単純にはシステムごとに異なるマスターの調整を行ったり、データの粒度をそろえたり、行うべきことはとてもたくさんあります。これらの作業をデータ利用者に強いるのは大変酷なことです。データ利用者はそれぞれのマスターの仕様なんて知らないのですから。
これが統合されたようで統合されていないデータの落とし穴です。システム部門は「データが1か所に集まったのだからあとはデータ利用者が利用するだけ」になったと思っていますが、データ利用者からは利用するためには大変な作業が必要な「実は使えないデータの集まり」がそこにあるだけという使われないデータ環境ができただけということになります。
本当の意味でのデータ統合
データを統合するということはデータ利用者が気持ちよくデータを利用できるようにしてあげることが必要です。企業が完成された製品をお客様に提供するのと同じようにデータ利用者が利用しやすいデータ製品を提供する必要があるのです。それが「データを統合する」ということなのです。
統合されたデータの価値
めでたく正しくデータが統合され、データ製品が提供される環境ができたときそれはどのような価値を生むのでしょうか?
サイロ化されたデータ
1つのシステムから生み出されてデータだけを利用してその分析を行ってみます。例えば航空会社の予約・発券システムのデータを利用するとしましょう。
そのお客様がよく自社の飛行機を利用してくれているのかがわかります。どの路線が予約が多い路線なのかもわかります。今年の年末年始時期が現在どのくらい混雑しているかもわかります。なんだかいろいろなことがわかりますね。
じゃあこのシステムのデータを分析するだけで十分じゃない?そう思わせてしまうのがサイロ化されたデータの罠です。複数のシステムのデータを組み合わせることでもっといろいろなことが分かるのにそれを行う必要がないと錯覚させてしまうのです。
統合されたデータが生み出す価値
それでは先ほどの予約・発券システムのデータに座席管理とフライトスケジュールのデータを組み合わせてみましょう。さらにどんなことができるでしょうか?
ある便の予約はそこそこに埋まってきていますが、事前に特別費用が必要な「足元の広い席」の指定状況が芳しくないようです。このままではいつもは得られている特別費用の分の収入を得ることはできません。それではここにキャンペーンを行ってみましょう。「足元の広い席」を事前指定されたお客様にマイルのプレゼントなどいかがでしょうか?
そのキャンペーンが功を奏し、無事、特別費用が必要な座席の指定は完売となりました。さらに!普段はそのような座席の事前指定が少ない近距離の便でも事前指定が増えました!
このような施策の実施は予約・発券システムのデータだけではわからないことでした。このように様々なデータを組み合わせることで新たなビジネス価値が生まれること、これが「データを統合することで生まれるいいこと」の真の姿です。
より多くのデータを統合し利用しうるすべてのデータの統合が完了すると、実施しうるすべての施策につながるデータ分析が可能になりデータの価値が最大になるのです。
おわりに
データ統合という言葉の持つ本当の意味いかがでしたでしょうか?
データ利用者が本当に必要とするデータ製品の提供にぜひトライしてみてください。その先にデータによって意思決定が行われるDXの真の価値があります。