8
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Ateam LifeDesignAdvent Calendar 2023

Day 18

Tableauでオープンデータ活用!初心者でも活用出来る方法を共有!

Last updated at Posted at 2023-12-18

はじめに

  • この記事は、Ateam LifeDesign Advent Calendar 2023の18日目の記事です。
  • Tableauを用いてオープンデータ(国勢調査など)を活用する方法を記載します。
  • 出来るだけ初心者の方でも簡単に分析出来るように順を追って説明出来ればと思います。

オープンデータを活用するメリット

  • 色々とあるかと思いますが、大きな部分は下記の二点かなと思います。
    • 効率的にデータを活用出来る
      • 政府や自治体が大量のデータをまとめて公開して下さっているので、個人や各法人では収集が難しいデータを簡単に利用することが出来ます。
    • 市場の傾向や動向が確認出来る
      • 市場の傾向や動向を正しく把握した上で効果的な戦略を立案することが出来ます。

早速分析してみよう!

オープンデータを検索

  • オープンデータを利用するにはe-Stat 政府統計の総合窓口がお勧めです。
  • 総務省統計局が整備し、独立行政法人統計センターが運用管理を行っており、国勢調査のデータなど大量のオープンデータが公開されています。
  • 今回は日本の人口データを分析してみます。
  • e-Statのトップページのキーワード検索に「人口」と入力し、検索
    • 検索以外も例えば上部の分野や組織などから絞り込んで検索も出来ますので、また試してみて探しやすいやり方で使ってみて下さい。
      image.png

  • 検索すると人口に関する統計の一覧が表示されます。
  • 左側で統計分野(人口・世帯、住宅・土地・建設など)で絞り込めたり、フォーマット(Excel、PDFなど)で絞り込めます。
  • 今回は国勢調査を選択します。
    image.png

  • 「都道府県・市区町村別の主な結果」のファイル部分を選択
    tempsnip.png

  • Excelをダウンロード出来る画面に遷移するので令和2年のExcelをダウンロード
    image.png

オープンデータをTableauで分析

  • Tableau Desktopの接続からMicrosoft Excelを選択し、先ほど保存したファイルを選択

    • Tableau Prepでも取り込めますが、今回はTableau Desktopでのやり方を紹介します。
      image.png

  • 左側にある「第1面事項_2020年」を右側にドラッグするとデータを取り込めます。

    • 取り込んだデータ(右下の部分)を確認すると分析したいデータとしてはまだ適切に取り込めていないことが分かります。
      image.png

  • これはなぜなのか、元のExcelを開いて確認してみます。

    • Excelを確認すると、1行目~2行目にデータの説明が記載されており、5~9行目に項目名が10行目以下に値が入っています。
    • そのため先ほどのような形でデータが入っていました。
      image.png

  • このような場合だと分析する前にデータの加工が必要になってくるかと思いますが

    • Tableauには便利な機能が入っており、データインタープリターという機能を使うと
    • Tableauでヘッダーや項目の部分を自動で識別し、データを取り込んでくれます。
    • ただし万能という訳ではないので試してみて、適切に取り込めていなさそうであればデータの加工を行う必要があります。
  • やり方は先ほどの画面の左側に「データインタープリターの使用」というチェックボックスがあるので

    • ここにチェックを入れると実行することが出来ます。
    • チェックを入れ、処理が完了すると「データインタープリターを使用してクリーニングされました」というメッセージに変わります。
    • 右下にある取り込んだデータを確認すると、フィールドに項目名が入っており、適切に取り込めていることが分かります。
    • この時にExcelと比較し、正しくデータが入っているか、確認することをお勧めします。
      tempsnip.png

  • 問題なければ項目名を分析しやすい形に変更していきます。

    • 都道府県や市区町村の前にコードが入っているので、コードを削除した形で作成します。
    • 変更したい項目の右側に「▼」マークがあるのでそこをクリックし、「カスタム分割」を選択します。
      image.png

  • データを見ると「_」の後に都道府県名が入っているので区切り文字は「_」を入力し、後半部分を持ってきたいので分割は最後を選び、OKをクリックします。
    image.png

  • そうすると↓の画像の通り、都道府県名の部分のみを抽出出来ます。
    image.png

  • 項目名を「都道府県」に変更し、分割前の項目は使わないので非表示にします。

    • 市区町村についても同様の処理を実施します。
    • その際に「=Abc」と記載がある部分をクリックし、地理的役割を適切なものを選択していると分析するときに便利です。
      image.png

    image.png

  • 可視化出来る状態になったので左下のワークシートに移動からグラフを作成してみます。
    image.png

  • ここではTableauの詳細な使用方法は割愛しますが、可視化したい項目を行列に入れるとグラフが描画されます。
    ※ 出典:政府統計の総合窓口(e-Stat) 国勢調査のデータを加工して作成
    image.png

  • このときに気を付けないといけないことがあります。

    • 例えば愛知県だと下記のように市区町村部分にも愛知県というデータが入っており、また名古屋市も名古屋市と名古屋市○○区という括りでもデータが入っているので重複してカウントしないように気を付けなければいけません。
    • 先ほどのグラフだと都道府県データだけを見たかったので、[都道府県] = [市区町村]という計算フィールドを作成し絞り込んでいます。
    • 市区町村別に見たいときも重複して計算することがないように注意が必要です。
      image.png

  • 作成したグラフを共有する場合(例えばTableau Publicに公開など)はデータ出典元の利用規約に従い、共有が可能な場合も出典を忘れずに記載するようにしましょう。

まとめ

  • ここまででオープンデータを活用出来る状態は出来たと思うので、あとは皆さんが持っているデータと結合して見ていくと、より活用の幅が広がると思います。

    • 例えば未出店のエリアに絞り、総人口が多いエリアはどこなのか、人口増減率はどうなのか、
    • 総人口だけでなくターゲットとなる男性もしくは女性の人口はどうなのかなど
    • オープンデータを活用していくことで市場の動向を分析した上で効果的な戦略を検討出来るようになると思います。
  • 今回はe-Statのデータを用いて分析しましたが、他にもオープンデータをまとめているサイトはたくさんありますし

    • また人口データだけでなく、複数のデータを組み合わせることで、より効果的な分析が出来ると思います。

  • 最後までご確認頂きありがとうございました。

  • 私自身もオープンデータを今後、更に活用していきたいと思いますし、皆さんと一緒に活用出来れば嬉しく思います。

  • 本記事が何か一つでも皆さんのお役に立てれば幸いです。

8
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
8
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?