Edited at

練習用分析データが無ければ、オープンデータを使えばいいじゃない!

More than 1 year has passed since last update.

・PowerBIで色々遊びたいけど、活用しやすいデータが手元にない。

・社内データを使う敷居が高いので、気軽に勉強できない

と、お困りも方もいらっしゃるのではないかと。

ということで、手元にいいデータが無くても、

オープンデータを中心に無料で利用できるサイトを色々紹介。

…あまりPowerBI関係ないw


1 Data.go

thumbnail

日本のオープンデータカタログサイト。

中央省庁が保有する行財政や経済、環境、観光、気象など、あらゆる分野の統計情報が格納されています。

残念ながら、格納されているデータはすべてが機械判読できるデータではないので注意が必要です。


2 e-stat

thumbnail

政府統計のポータルサイト。

上記Data.goよりもデータ量は豊富です。

ただし、ダウンロードできるデータのほとんどは人が見やすいデータの表示形式。

ETLの技術が試されます。(練習には最適かもw)


3 RESAS

thumbnail

地域経済分析システム、略してRESAS。

地方創生をテーマとして、地方自治体単位の様々なデータが可視化できるサイトです。

本来はブラウザベースで手軽に可視化できることが売りですが、

ビジュアル単位で元データをダウンロードすることも可能です。

こちらでダウンロードできるCSVデータは比較的取り込みやすく整形されています。


4 DATA.GOV

thumbnail

アメリカのオープンデータカタログサイトです。

こちらもデータ読み込みしやすい形式としにくい形式のデータ混在していますが、

日本よりは比較的整備されている印象。

PowerBI関係無いですが、オープンデータ使ったアプリケーションの紹介なんかもあります。


上記までで記載したData.goやe-stat、RESAS、DATA.GOVは、いずれもAPIを提供しています。

手作業でCSVをダウンロードしてもいいですが、操作慣れていればAPI経由のPowerQueryを書いてもいいかもしれません。

PowerBIでAPIを実装する方法は以下記事と、コメントで記載されています。

【PowerBIメモ】RESAS APIとRを使ってデータセットを作ってみる



5 Kaggle

thumbnail

データサイエンス業界では知らない人がいないコンテストサイト、kaggle。

データサイエンティストが腕を競い合い、情報交換をする場ですが、

様々なデータセットが格納されており、アカウント登録をすれば誰でも使うことが可能です。

バラエティに富んだデータを可視化できるのはとても魅力的。


6 DeepAnalytics

thumbnail

日本版のKaggleと言うべきサイト。

Kaggleほどデータセットが豊富ではないですが、サンプルコンテストのデータはいつでもダウンロードできます。


7 UCI Machine Learning Repository

thumbnail

カリフォルニア大学アーバイン校が公開している機械学習用のサンプルデータセット。

おおよそ400のデータセットが公開され、誰でも使用可能になっています。

PowerBIで扱うにはあまり適していないデータもありますが、

多くのデータは、可視化・分析のいい材料になりそう。



おわりに

PowerBIを練習するにはまずはデータの用意から。

MicrosoftのサンプルデータでももちろんOKですが、

自分でデータ選択して可視化してみるのも面白いですね。

なお、ここに記載したサイトのデータ利用にあたっては、各サイトのデータ利用規約等を守ってください。