目的
時代の流れに乗って自社のデータ活用ビジネスを行いたいと考えている企業担当者は多いです。ただそもそも何をすればいいのか分からない状態の方も一定数います。 と言うわけで、セールス視点で「何となくデータ分析を行いたいと考えている顧客に対する提案」をする際の必要知識についてまとめてみました。
全体像
以下のようなイメージで1つ1つ紐解いていきます。
それぞれの製品比較については別記事でまとめる予定。
1. データソース(API連携)
端的に言うならば、データ源となる資産を持っているのにもかかわらず、それを「使えるデータ」として手元に残しておく術を持っていないユーザは一定数いる。
究極は「紙でしかデータを保存していない」と言うパターン。
救急医療の現場とかでは、急患の情報を壁に張り紙形式のメモで管理しているところもあるっぽい。。。
画像(※写真はイメージです):付箋ポストイットのおすすめ強粘着。ノートに繰り返し何度も貼れて使える。アイデア出しに
ユーザ側の立場でAPI連携が充実したシステムの導入が必須の理由がよく分かる記事が以下。
グローバル化すると国産システムは土俵にも立てないよなぁ。。。
「日本ではよくパートナーやベンダーの営業さんが『システム連携できます』と言うが、『本当にできますか?』と聞くと、『いや、CSVです』とかいう話になる。それはシステム連携とは言わないし、『シングルサインオンって何ですか?』っていう状況になることもある」
また、海外でも同じシステムを利用できるという条件もかなり厳しいものだという。実はこの条件を設定すると、国産システムはほぼ候補から外れてしまう。
「将来的に、例えばインドやシンガポールに開発拠点やサポート拠点を移すとなった場合、英語で仕事ができるシステムなのかと考えると、その時点で国産システムはほぼ選べない。同時に、日本にサポート拠点がないようなシステムは導入に失敗しかねないことや2バイトコードへの対応といった問題もある。海外ではメジャーでも日本に拠点がないようなベンダーのシステムもリスクが高い」
2. データ収集(DataLake)
後述のDWHとの違いはInformaticaさんのサイトで解説あり。
端的に言うと、、、
Datalake→「加工していない生データを蓄積する」
DataWareHouse→「分析や解析するのに整理したデータを蓄積する」とのこと。
先にデータウェアハウスについて説明しましょう。データウェアハウスは、社内の各種アプリケーションやデータベースに保管された規則性を持った構造化データを収集し、目的別に定義された形に統合・格納して、分析業務で利用するためのデータストアです。
一方、データレイクが得意とするのはセンサーのログやGPSデータ、SNSのテキストなどビジネスに関連して時々刻々と生み出されるようないわば生のデータを統合して取り扱うソリューションです。通常、これらの多種多様なデータはネットワークを経由して集められます。
2-1. DataLake主要製品
- Cloudera
- MapR
3. データ加工(ETL)
画像引用:【図解】BIツールと「DWH」や「ETL」との違いとは?
3-1. ETL主要製品
- Informatica
- DataSpider
4. データ蓄積(Data WareHouse)
画像引用:【図解】BIツールと「DWH」や「ETL」との違いとは?
4-1. DWH主要製品
大量のデータを保管する必要があることから、やはり大手プレイヤーの名前が挙がる。
- AWS Redshift
- GCP BigQuery
- Snowflake
5. 分析①(BIツール)
ここまでの下準備ができてようやく「データ分析」ができるようになります。
近年ではBIツール自体に機械学習やETLの機能を持ち合わせたものが出てきていますが、一応定義としてはBIは「データの可視化」のニュアンスのもの。
画像引用:【図解】BIツールと「DWH」や「ETL」との違いとは?
5-1. BI主要製品
- Tableau(タブロー)
- Oracle BI(オラクル ビーアイ)
- MotionBoard(モーションボード)
- Looker
6. 分析②(機械学習)
整形されたデータを持って初めて機械学習にかけれるようになる。
7. まとめ
謳い文句のように「御社でもデータ活用を!!」みたいな営業があるが、顧客の内部事情によってやることが全然違う。売る側からすれば売れればいいや、みたいな気持ちがあるのかもしれないけど、長期的に顧客に信頼されるセールスとなるためにも知識を体系化していきたいところ。