Googleデータポータル(Data Studio)とは
Google Data Studioは、Googleが提供するカスタムレポートやダッシュボードを手軽に作成するためのツールです。使用するオープンデータ
今回はkaggleのWorld Happiness Report(世界幸福度調査レポート)を使用します。 World Happiness Reportは、世界の幸福の状態に関する調査です。155カ国と地域を幸福度でランク付けしたものです。項目は幸福度に関わると考えられる以下の8つです。この項目は毎回見直され、更新されています。 そのため2019年と同じ項目なのは2018年のものだけです。今回は初回のため、その中で2019年だけを使用していきます。
項目(原語) | 項目(日本語) |
---|---|
Country or region | 国・領域 |
Score | 幸福度 |
GDP per capita | 一人当たりのGDP |
Social support | ソーシャルサポート |
Healthy life expectancy | 健康寿命 |
Freedom to make life choices | 人生の選択をする自由 |
Generosity | 寛大さ |
Perceptions of corruption | 腐敗の認識 |
ダウンロードしたデータ
こちらがダウンロードしたデータになります。通常は前処理が必要となりますが今回はそのままBigQueryに入れても文字化けやエラーにはならないため、このまま入れます。 ダウンロードしてきたCSVデータの文字コードはShift-jisのため、 そのまま読み込むと文字化けが起きます。必ず文字コードはUTF-8に変換してからアップロードしましょう。 (BigQueryはUTF-8しか対応してないらしいです。) ![worldhappiness date.JPG](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/868828/31331a9d-c478-0cfb-4ca3-e4a0a2d07d19.jpeg)BigQueryにデータを入れて抽出・集計する
BigQueryにデータをいれる
BigQueryにデータをいれていきます。 データの入れ方は下記記事と殆ど同じです BigQueryにオープンデータを入れてみた【初心者】クエリを実行する
```` select Country_or_region, Score, GDP_per_capita, Social_support from score.2019 order by 1 desc limit 10; ````データを確認する
このようにデータが書き出されています。 こちらを可視化していきます。 ![score10.JPG](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/868828/4c3e231d-3bb1-3baf-c3b8-f41fcf19dc01.jpeg)ビューとして保存
上記の結果を、Google Data Studioに接続して使用するため、ビューとして保存をします。 今回はScore-という名称とします。 ![score10-2.JPG](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/868828/7f6fd43f-3350-3928-2552-86b16a59534e.jpeg) こちらで準備は完了です。 GoogleDataStudioにて可視化をしていきます。GoogleDataStudioで可視化する
BigQueryと接続する
まず、下記GoogleDataStudioのページにアクセスし、新しいレポートの開始を選択します。 Google Data Studio 画面右下の「新しいデータソースを作成」ボタンを押下し、先ほど作成したデータを読み込んでいきます。 ![score12.JPG](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/868828/6408af75-b0f7-095c-1dfd-787267181f73.jpeg) 先ほど保存したビューを選択し、BigQueryと接続します。 BigQueryと接続を行うと、下記画面が出てきます。 ![score11.JPG](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/868828/fd7a0fed-9468-ff4d-4e70-7233aa739c32.jpeg) 「空のレポート」の部分をクリックし、「BigQuery」を選択し、「BigQuery→worldhappiness→score→GDP-socialsupport」 」先ほど保存したデータを選択します。 ![score17.JPG](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/868828/60c76c89-4e0a-c5c1-e371-a81b12c71068.jpeg) 選択したのち、グラフ・表など可視化できるようになりました。 ![score15.JPG](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/868828/a151ab2e-d9bb-f76f-2599-73a017ad0da6.jpeg)今回は、生データではなくすでにデータ化されているものをそのまま可視化しました。
幸福度数がトップ10の国とGDPに関係性があるのかどうかを確認するためのグラフ化ですが、このデータだけでは関係性も見えないので、GDPが低い国との比較も必要と考えます。
今後は地域分類をしてアジアやヨーロッパなどの地域性が関係があるか、それとも貧富の差での幸福度数に差が出るのかなどのことも調査してみたいですね。初心者が一データでできるのはここまでだったので次回の課題としてみます。