6
7

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

GSuite導入 BigQueryとData Studioを用いてデータ解析

Posted at

はじめに

社内業務効率化をするために、データ解析を行いたいというイメージはあるが、
ツールの種類が多すぎて、方針が定まらないなどが多いかと思います。

最近では社内の業務効率化の一貫で、GSuiteを導入されている企業が多いと思います。
Googleはデータ解析の利用にも、非常に秀でているので、Googleのサービスを極力使用して、データ解析の業務効率化をしてみましょう。

今回の設計図は以下です。
こちらのサイトを参考に、国税庁の法人番号公表サイトのcsvデータを使用させていただきました。

フロー図

1. csvデータを用意する

自身のお持ちのcsvファイルをご用意ください。
今回デモでは、国税庁の法人番号公表サイトのcsvデータを使用しますので、サンプルで試される方は、こちらから「csv形式 unicode」の東京都のzipファイルをダウンロードしてください。
法人番号サイト.png

2. Google Driveにアップロードする

今回はGSuiteを利用していることを想定していますので、ファイル管理はGSuite上で行われていることを想定します。
GSuiteを契約されている場合は、ストレージが無制限であるため、大きなファイルサイズも気にせずアップロードできます。
先ほどダウンロードしたcsvファイルを、Google Driveにアップロードします。

image.png

BigQueryからファイルを参照できるように、リンクを取得しましょう。
使用するcsvファイルを右クリックして、「共有可能なリンクを取得」を選択してください。
image.png
以下のポップアップが表示されたら、リンクをコピーしましょう。
image.png

3. BigQueryで解析する

BigQueryのコンソール画面を起動します。
コンソール画面の開き方が分からない方はこちらを参照してください。
使用するリソースとデータセットを作成します。データセットを選択すると、右下に「テーブルを作成」がありますので選択してください。
テーブルの作成元からは、直接UploadやCloud Storageなどとも連携出来ることが確認できますが、今回はドライブを利用します。
先程コピーしたリンクを貼り付けましょう。こちらのサイトを参考にしながら、適宜必要な項目を入力します。
image.png

テーブルの作成が完了すると、左下に「table_1」(※自分で命名したテーブル名)が作成されたことが確認できます。
選択をすると、左下にテーブルが読み込まれていることが確認できます。
それでは、早速データを解析していきたいので、青枠にクエリを入力していきます。
今回は以下のように入力しました。

sample.sql
SELECT city, count(compuny_number) AS company_number FROM `gcp-data-analytics.dataset.table_1` GROUP BY city ORDER BY company_number DESC

クエリを入力したら、赤枠の「実行」を押してみましょう。

image.png

結果が右下に表示されたことが確認できます。
このように様々作成したクエリをBigQueryで実行すると、大規模のデータに対しても高速に結果を返すことができますので、各々目的の結果に加工していきます。
image.png

出力した結果を保存する

上の画像の青枠「結果を保存する」を選択しましょう。
csvやjson形式、スプレッドシートとしてなど保存できます。
今回は業務上、チームメンバーにも閲覧してもらいたいので、スプレッドシート形式で出力してみましょう。
選択して、Google Driveに戻ってみると、「result-●●」の形式で保存されていることが確認できます。
image.png

Data Studioと連携する

上の画像の赤枠「データポータルで調べる」を選択しましょう。
Data Studioについては次の章で説明します。

4. Data Studioでビジュアル化

作成したデータを営業職や販売スタッフなどに、手軽にデータ活用していただきたいので、整理したデータをBIツールで加工しましょう。
BIツールで検索するとTableauの情報が多く出てきますが、日頃GSuiteを使い慣れているのあれば、Data Studioも使いやすいかもしれないですね。
先程連携した、BigQueryの実行結果が下の図の右側に反映されています。
試しに円グラフとテーブル形式で表示してみましょう。
image.png

まとめ

一言でデータ解析をするといっても、何から手を付けていいかがイメージできないかもしれませんが、
自分の普段扱っているデータで試してみてください。
非常にお手軽な上に、Data Studioは現在無料のため、BigQueryのみの課金でデータを解析することが可能です。
BigQueryやData Studioは Google Driveと非常にシームレスにデータ受け渡しができます。
またデータBigQueryでクエリ作成を難しく感じる場合には、TreasureDataを導入したり、BIツールはTableauなど他社のサービスとも連携がしやすかったりします。
様々な選択肢がある分、導入のコストが高く感じますが、データ解析は解析したい目的がありきの作業になります。
難しく考えずに是非一度試して実感してみましょう。

6
7
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
7

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?