オープンデータ
PowerBI

練習用分析データが無ければ、オープンデータを使えばいいじゃない!

・PowerBIで色々遊びたいけど、活用しやすいデータが手元にない。
・社内データを使う敷居が高いので、気軽に勉強できない

と、お困りも方もいらっしゃるのではないかと。

ということで、手元にいいデータが無くても、
オープンデータを中心に無料で利用できるサイトを色々紹介。
…あまりPowerBI関係ないw

1 Data.go

thumbnail
日本のオープンデータカタログサイト。
中央省庁が保有する行財政や経済、環境、観光、気象など、あらゆる分野の統計情報が格納されています。
残念ながら、格納されているデータはすべてが機械判読できるデータではないので注意が必要です。

2 e-stat

thumbnail
政府統計のポータルサイト。
上記Data.goよりもデータ量は豊富です。
ただし、ダウンロードできるデータのほとんどは人が見やすいデータの表示形式。
ETLの技術が試されます。(練習には最適かもw)

3 RESAS

thumbnail
地域経済分析システム、略してRESAS。
地方創生をテーマとして、地方自治体単位の様々なデータが可視化できるサイトです。
本来はブラウザベースで手軽に可視化できることが売りですが、
ビジュアル単位で元データをダウンロードすることも可能です。
こちらでダウンロードできるCSVデータは比較的取り込みやすく整形されています。

4 DATA.GOV

thumbnail

アメリカのオープンデータカタログサイトです。
こちらもデータ読み込みしやすい形式としにくい形式のデータ混在していますが、
日本よりは比較的整備されている印象。
PowerBI関係無いですが、オープンデータ使ったアプリケーションの紹介なんかもあります。


上記までで記載したData.goやe-stat、RESAS、DATA.GOVは、いずれもAPIを提供しています。
手作業でCSVをダウンロードしてもいいですが、操作慣れていればAPI経由のPowerQueryを書いてもいいかもしれません。

PowerBIでAPIを実装する方法は以下記事と、コメントで記載されています。

【PowerBIメモ】RESAS APIとRを使ってデータセットを作ってみる


5 Kaggle

thumbnail
データサイエンス業界では知らない人がいないコンテストサイト、kaggle。
データサイエンティストが腕を競い合い、情報交換をする場ですが、
様々なデータセットが格納されており、アカウント登録をすれば誰でも使うことが可能です。
バラエティに富んだデータを可視化できるのはとても魅力的。

6 DeepAnalytics

thumbnail
日本版のKaggleと言うべきサイト。
Kaggleほどデータセットが豊富ではないですが、サンプルコンテストのデータはいつでもダウンロードできます。

7 UCI Machine Learning Repository

thumbnail

カリフォルニア大学アーバイン校が公開している機械学習用のサンプルデータセット。
おおよそ400のデータセットが公開され、誰でも使用可能になっています。
PowerBIで扱うにはあまり適していないデータもありますが、
多くのデータは、可視化・分析のいい材料になりそう。


おわりに

PowerBIを練習するにはまずはデータの用意から。
MicrosoftのサンプルデータでももちろんOKですが、
自分でデータ選択して可視化してみるのも面白いですね。

なお、ここに記載したサイトのデータ利用にあたっては、各サイトのデータ利用規約等を守ってください。