はじめに
みなさん、DataStudioって知ってますか?(日本での名前がデータポータルに変わってしまいましたが、urlがまだdatastudioなので、そのまま呼びます。)
DataStudioはGoogleが提供しているBIツールです。
近頃、「データの民主化」という言葉が流行し、BIに興味のある企業の方も多いのではないでしょうか?
そもそもBIって何? と思う方もいると思うので、BIツールで有名なTableau社の説明を参照します。
BI (Business Intelligence) は、データから有用な情報を引出しビジネスの成長に活かすための仕組み
結構ふわっと書かれていますが、自分の中では、「データを可視化、集計しながらビジネスに有用な知見をデータから引き出すこと」と捉えています。
さて、いざBIツールを導入しようとしても、有料のツール(Tableau, Lookerなど)は高性能ですが、使う人の分だけアカウントが必要なため共有しづらかったり、最低購入数がある場合もあり、「なんとなくやってみよう」レベルのスモールスタートに向きません。
また、無料のツールでも、大抵UIがイケてなくて使う気力が起きなかったり、操作が小難しいなど機能がかなり制限されてしまいます。
そこで、無料で使えて、UIがイケてて、使い勝手が良くて共有が簡単というBIのスモールスタートにぴったりのツールが、DataStudioなんです。
可視化はなぜ重要なのか?何の為に可視化するのか?
少し戻って、そもそも、なぜ可視化が必要なのか考えてみようと思います。
ちょっとだけ付き合ってください。
突然ですがクイズです。以下の表の中で最も大きい数字を答えてください!
どのくらいかかりましたか?5秒以内に答えられた方、いらっしゃいますか?
数字がごちゃごちゃしていて、見づらいですよね。
では、これを、ヒートマップで可視化すると、こんな感じになります。
今度は5秒以内に答えられるんじゃないでしょうか?
数字の大小を色の強弱で表しているので、一目見てパッと数字が大きいところがわかります。
今回の例の数値は適当に乱数で、生成させた数字なので、特に傾向はありませんが、例えばあるサービスのユーザー数を横軸に曜日、縦軸に時間をとって表示すれば、一目でそのサービスが利用されている時間帯がわかります。
では、次の例行ってみましょう。
次は、都道府県毎のあるサービスのユーザー数のデータです。
都道府県 | 北海道 | 鹿児島県 | 愛媛県 | 滋賀県 | 長野県 | 福岡県 | 徳島県 | 群馬県 | 岡山県 | 佐賀県 | 熊本県 | 大阪府 | 山梨県 | 宮城県 | 長崎県 | 東京都 | 神奈川県 | 鳥取県 | 香川県 | 広島県 | 富山県 | 岩手県 | 奈良県 | 石川県 | 福島県 | 茨城県 | 和歌山県 | 新潟県 | 福井県 | 山形県 | 静岡県 | 島根県 | 兵庫県 | 愛知県 | 埼玉県 | 青森県 | 三重県 | 千葉県 | 山口県 | 京都府 | 栃木県 | 高知県 | 沖縄県 | 秋田県 | 宮崎県 | 大分県 | 岐阜県 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ユーザ数 | 1353 | 4373 | 3768 | 6915 | 3180 | 2906 | 3132 | 4039 | 3902 | 4642 | 1189 | 3747 | 2580 | 7679 | 5027 | 5864 | 3240 | 6617 | 6352 | 3823 | 6681 | 8628 | 5945 | 5676 | 9206 | 5484 | 5191 | 1504 | 5512 | 8611 | 1691 | 6161 | 5835 | 3534 | 6798 | 9225 | 6247 | 3260 | 1714 | 2704 | 2860 | 2111 | 1574 | 7137 | 4788 | 6474 | 6345 |
これを見ても、「ふーん」くらいで終わってしまい、特に傾向とかは見つけられないと思いますが、これを地図上にプロットしてみるとどうでしょうか?
ユーザー数の大小を色の強弱で表していて、ユーザーは東北地方に集中していることが瞬時にわかります。
このように、数字の羅列を眺めているだけではわかることは僅かで、理解するのにもとても時間がかかりますが、可視化の力を利用すると一目で問題点の特定や、データの特徴を把握できます。
これを実務に置き換えると、KPIなど重要な指標を時系列でモニタリングすることで、
- 何か施策を打った時の効果を測定する
- 現状に異常な変化が起こっていないか監視する
- 周期性などデータの特徴を理解する
などが可能になり、データ活用の地盤ができてきます。
下記の参照記事でも書いてありますが、組織にデータ活用を浸透させる第一歩は、現状の可視化をすることによって問題点、活用状況など含め、現状を理解することにあるのではないでしょうか?
超簡単に可視化できるツール:Google DataStudio(データポータル)の紹介
前項で、可視化の有用性について伝えさせて頂きました。
ここからは、DataStudioの機能について書きます。
接続できるデータソース
Googleの主要なサービスには接続できるようになっていて、ローカルファイルもアップロードして接続できます。
- BigQuery
- Google Ads
- Attribution 360
- Cloud SQL
- Google Analytics
- Google Sheets
- MySQL
- PostgreSQL
...
その他、パートナーコネクタというものも多数用意されていて、twitterやYoutube, Facebookなんかにも接続できます。AWSのデータへのコネクタは用意されていないようです。
データソースの一覧表が見つからなかったので、気になる方は下のリンクから見てみてください。
料金
冒頭でも述べましたが、無料で使えます。(BigQueryなどの有料サービスに接続する場合、クエリの料金は課金されます。)
共有方法
通常のGoogleのサービスのように、リンク取得での共有の他に、PDF形式でのエクスポートにも対応しています。
権限も閲覧権限、編集権限を分けられます
共同編集
Google sheet, Google documentなどのサービスと同様に、複数人が共同編集できます。
##グラフの作成
DataStudioには、ダッシュボードを構築し、指標を定点監視するのに向いたレポートと、探索的な分析を行えるエクスプローラの機能がありますが、主要な機能はレポートなので、レポートのみ紹介します。
いくつかサンプルのデータも用意されているので、今回はGoogle analyticsのサンプルデータを使用します。
###折れ線グラフの描画
DataStudioが自動で横軸に期間を表す指標、縦軸に数量を表す指標を設定し、セッション数の時系列推移を表示してくれました。
指標の追加
指標は複数追加することもできます。試しに、UU数も表示してみましょう。
グラフの調整
グラフの色やポイントの表示なども簡単に切り替えられます。
ページネーション
ページを切り替えられるので、デイリー、ウィークリー、マンスリーでページを分けたいときや、テーマを分けたいときに活用できます。
表示期間の変更、フィルター
このように、ドラッグ&ドロップの簡単な操作だけで、綺麗なグラフが描けます。
さらに、表示期間の変更やフィルタリングなど要点を抑えていて、機能面も過不足ありません。
DataStudioの向き不向き
BIツールには大きく下の2つの機能があります。
- 探索的な分析機能
- ダッシュボードによる一覧化
DataStudioにはどちらの機能も備わっていますが、特に2番目のダッシュボードによる一覧化、中でもKPIのような定常的に監視する必要のある指標を定点監視することに秀でているツールだと思います。
1番目の、探索的な分析機能も備わっていますが、Tableauなど他のBIツールと比較すると、使い勝手が劣ります。
また、データサイエンティストの方であれば、探索的なデータ分析には、Jupyter notebookやRという強力なツールもあるので、そちらを用いた方が良いと思います。
あくまで、DataStudioはデータ活用の第一歩として、KPIモニターダッシュボードを誰でも見ることのできる状態にしたい時が主なユースケースだと思います。
####補足:Tableauとの比較
僕は普段Tableau, DataStudioを使っていて、共有してモニタリングしたい系は極力DataStudioで作成するようにしていますが、一部TableauにあってDataStudioにない機能があるので、紹介します。
- パラメータ:Tableauだとパラメータという可変の値を用いることができ、AとBの比較みたいなものを簡単に出せたり指標を可変にできたりする
- LOD:1つのシートに複数の集計レベルでのグラフを入れ込める。(例:特定セグメントのデータと全体平均との比較)
DataStudioでは必要最小限の機能が実装されていて、自由度の高さはTableauには劣ります。
自由度が低いことは、デメリットのように感じられますが、こだわれないので素早くグラフを作れる、誰がやっても綺麗なグラフになるというメリットもあります。
まとめると、より柔軟でインタラクティブなチャートを作りたい時はTableau, 固定された指標をモニタリングしたい場合はDataStudioという使い分けになりそうです。
おわりに
可視化の有用性、データスタジオの機能紹介、向き不向きとまとめてきました。
データを活用したいと思うけど、ちょうど良いツールがないという悩みを抱えている方、多いのではないでしょうか?
この記事で、そんな方たちの悩みを解決できたら嬉しく思います。
皆さんもぜひ、KPIをDataStudioでモニタリングするところから、データ活用を初めてみてはいかがでしょうか?