はじめに
社内業務効率化をするために、データ解析を行いたいというイメージはあるが、
ツールの種類が多すぎて、方針が定まらないなどが多いかと思います。
最近では社内の業務効率化の一貫で、GSuiteを導入されている企業が多いと思います。
Googleはデータ解析の利用にも、非常に秀でているので、Googleのサービスを極力使用して、データ解析の業務効率化をしてみましょう。
今回の設計図は以下です。
こちらのサイトを参考に、国税庁の法人番号公表サイトのcsvデータを使用させていただきました。
1. csvデータを用意する
自身のお持ちのcsvファイルをご用意ください。
今回デモでは、国税庁の法人番号公表サイトのcsvデータを使用しますので、サンプルで試される方は、こちらから「csv形式 unicode」の東京都のzipファイルをダウンロードしてください。
2. Google Driveにアップロードする
今回はGSuiteを利用していることを想定していますので、ファイル管理はGSuite上で行われていることを想定します。
GSuiteを契約されている場合は、ストレージが無制限であるため、大きなファイルサイズも気にせずアップロードできます。
先ほどダウンロードしたcsvファイルを、Google Driveにアップロードします。
BigQueryからファイルを参照できるように、リンクを取得しましょう。
使用するcsvファイルを右クリックして、「共有可能なリンクを取得」を選択してください。
以下のポップアップが表示されたら、リンクをコピーしましょう。
3. BigQueryで解析する
BigQueryのコンソール画面を起動します。
コンソール画面の開き方が分からない方はこちらを参照してください。
使用するリソースとデータセットを作成します。データセットを選択すると、右下に「テーブルを作成」がありますので選択してください。
テーブルの作成元からは、直接UploadやCloud Storageなどとも連携出来ることが確認できますが、今回はドライブを利用します。
先程コピーしたリンクを貼り付けましょう。こちらのサイトを参考にしながら、適宜必要な項目を入力します。
テーブルの作成が完了すると、左下に「table_1」(※自分で命名したテーブル名)が作成されたことが確認できます。
選択をすると、左下にテーブルが読み込まれていることが確認できます。
それでは、早速データを解析していきたいので、青枠にクエリを入力していきます。
今回は以下のように入力しました。
SELECT city, count(compuny_number) AS company_number FROM `gcp-data-analytics.dataset.table_1` GROUP BY city ORDER BY company_number DESC
クエリを入力したら、赤枠の「実行」を押してみましょう。
結果が右下に表示されたことが確認できます。
このように様々作成したクエリをBigQueryで実行すると、大規模のデータに対しても高速に結果を返すことができますので、各々目的の結果に加工していきます。
出力した結果を保存する
上の画像の青枠「結果を保存する」を選択しましょう。
csvやjson形式、スプレッドシートとしてなど保存できます。
今回は業務上、チームメンバーにも閲覧してもらいたいので、スプレッドシート形式で出力してみましょう。
選択して、Google Driveに戻ってみると、「result-●●」の形式で保存されていることが確認できます。
Data Studioと連携する
上の画像の赤枠「データポータルで調べる」を選択しましょう。
Data Studioについては次の章で説明します。
4. Data Studioでビジュアル化
作成したデータを営業職や販売スタッフなどに、手軽にデータ活用していただきたいので、整理したデータをBIツールで加工しましょう。
BIツールで検索するとTableauの情報が多く出てきますが、日頃GSuiteを使い慣れているのあれば、Data Studioも使いやすいかもしれないですね。
先程連携した、BigQueryの実行結果が下の図の右側に反映されています。
試しに円グラフとテーブル形式で表示してみましょう。
まとめ
一言でデータ解析をするといっても、何から手を付けていいかがイメージできないかもしれませんが、
自分の普段扱っているデータで試してみてください。
非常にお手軽な上に、Data Studioは現在無料のため、BigQueryのみの課金でデータを解析することが可能です。
BigQueryやData Studioは Google Driveと非常にシームレスにデータ受け渡しができます。
またデータBigQueryでクエリ作成を難しく感じる場合には、TreasureDataを導入したり、BIツールはTableauなど他社のサービスとも連携がしやすかったりします。
様々な選択肢がある分、導入のコストが高く感じますが、データ解析は解析したい目的がありきの作業になります。
難しく考えずに是非一度試して実感してみましょう。