・PowerBIで色々遊びたいけど、活用しやすいデータが手元にない。
・社内データを使う敷居が高いので、気軽に勉強できない
と、お困りも方もいらっしゃるのではないかと。
ということで、手元にいいデータが無くても、
オープンデータを中心に無料で利用できるサイトを色々紹介。
…あまりPowerBI関係ないw
#1 Data.go
日本のオープンデータカタログサイト。
中央省庁が保有する行財政や経済、環境、観光、気象など、あらゆる分野の統計情報が格納されています。
残念ながら、格納されているデータはすべてが機械判読できるデータではないので注意が必要です。
#2 e-stat
政府統計のポータルサイト。
上記Data.goよりもデータ量は豊富です。
ただし、ダウンロードできるデータのほとんどは人が見やすいデータの表示形式。
ETLの技術が試されます。(練習には最適かもw)
#3 RESAS
地域経済分析システム、略してRESAS。
地方創生をテーマとして、地方自治体単位の様々なデータが可視化できるサイトです。
本来はブラウザベースで手軽に可視化できることが売りですが、
ビジュアル単位で元データをダウンロードすることも可能です。
こちらでダウンロードできるCSVデータは比較的取り込みやすく整形されています。
アメリカのオープンデータカタログサイトです。
こちらもデータ読み込みしやすい形式としにくい形式のデータ混在していますが、
日本よりは比較的整備されている印象。
PowerBI関係無いですが、オープンデータ使ったアプリケーションの紹介なんかもあります。
上記までで記載したData.goやe-stat、RESAS、DATA.GOVは、いずれもAPIを提供しています。
手作業でCSVをダウンロードしてもいいですが、操作慣れていればAPI経由のPowerQueryを書いてもいいかもしれません。
PowerBIでAPIを実装する方法は以下記事と、コメントで記載されています。
【PowerBIメモ】RESAS APIとRを使ってデータセットを作ってみる
#5 Kaggle
データサイエンス業界では知らない人がいないコンテストサイト、kaggle。
データサイエンティストが腕を競い合い、情報交換をする場ですが、
様々なデータセットが格納されており、アカウント登録をすれば誰でも使うことが可能です。
バラエティに富んだデータを可視化できるのはとても魅力的。
#6 DeepAnalytics
日本版のKaggleと言うべきサイト。
Kaggleほどデータセットが豊富ではないですが、サンプルコンテストのデータはいつでもダウンロードできます。
#7 UCI Machine Learning Repository
カリフォルニア大学アーバイン校が公開している機械学習用のサンプルデータセット。
おおよそ400のデータセットが公開され、誰でも使用可能になっています。
PowerBIで扱うにはあまり適していないデータもありますが、
多くのデータは、可視化・分析のいい材料になりそう。
#おわりに
PowerBIを練習するにはまずはデータの用意から。
MicrosoftのサンプルデータでももちろんOKですが、
自分でデータ選択して可視化してみるのも面白いですね。
なお、ここに記載したサイトのデータ利用にあたっては、各サイトのデータ利用規約等を守ってください。