ビッグデータを一言でまとめると
従来のデータベース管理システムなどでは記録や保管、解析が難しい 巨大なデータ群 のことです。
概要
一言で言うと 巨大な データ群ということになりますが、量意外にも大切な特性があります。
それが3Vと呼ばれる3つの特性です。
・Volume:データの量
→膨大なデータがあること
・Variety:データの種類
→偏ったデータではなく、多種多様なデータがあること
・Velocity:データの発生頻度/更新頻度
→データがリアルタイムで収集されていること
ビッグデータにははっきりした定義がないため、これら3つ全ての条件を満たすものもあれば、1つだけを満たすものもあります。
ビッグデータが着目されるようになった背景
一昔前までは企業の3大経営資源は 「ヒト・モノ・カネ」 であると言われてきました。
それが最近では、この3大経営資源に 「情報」 が追加され4大経営資源と言われるようになるほど、情報の優先順位は上がってきています。情報が溢れている昨今、この情報をどのように扱うかが企業の永続的な繁栄に不可欠な要素となっています。
他にもIoTとAIの発展が挙げられます。
IoT対応機器の増加に伴い、大量に集まったデータ(≒ビッグデータ)を、AIを駆使して解析し、最適な解を求める。
という流れが企業の意思決定の方法として注目されるようになりました。
これにより、新三種の神器とよばれる、「IoT、ビッグデータ、AI」は相互的に発展してきました。
導入事例
■ポイントカード
なぜ小売店ではお客さんに対して積極的にポイントカードを作成するように勧めるのかをご存知でしょうか?
いくつか理由はありますが、最も大きな理由は顧客の囲い込みとデータ分析です。
1つ目の顧客の囲い込みに関しては、皆さん知っていたと思いますが、もう1つの顧客のデータ分析という目的は知っていたでしょうか?
ポイントカードを作成する時には「住所、性別、生年月日」のような個人情報を記入しますよね。その情報と顧客毎に購入した商品を結びつけています。そうすることで、「この商品は色んな人が買っているのか、それともヘビーユーザーがいるのか」ということや「性別や年齢による購入対象の違い」といった多くの情報(ビッグデータ)をポイントカードを活用して集客しています。
■製造工場でのばらつき分析
同品種を大量生産するような工場では、規格内のモノを大量に作ることが求められます。しかし、実際には規格を超過し廃棄処分となるモノも多くあります。工場では、全く同じ条件で作業しているつもりでも実際には、機械の経年劣化や、天気の変化により微妙な誤差が生じていることもあります。そういった誤差をなくすために今までは、職人の勘に頼っていた部分も多くありましたが、作業者による差を無くそうという考え方が最近のトレンドです。そこで、今まで計測仕切れていなかった条件と作られたモノを、ビッグデータとして集計・分析することで製品を作る際の最適解を求めることができます。
終わりに
ビッグデータの定義は少し曖昧でどこからがビッグデータと呼ばれるというような線引きはありません。
大量のまたは色んな種類のデータがビッグデータとして扱われヒトが答えを出す際に使われているというくらいの感覚で捉えられればいいと思います。
最後までお付き合いありがとうございました。