79
90

More than 5 years have passed since last update.

練習用分析データが無ければ、オープンデータを使えばいいじゃない!

Last updated at Posted at 2017-12-18

・PowerBIで色々遊びたいけど、活用しやすいデータが手元にない。
・社内データを使う敷居が高いので、気軽に勉強できない

と、お困りも方もいらっしゃるのではないかと。

ということで、手元にいいデータが無くても、
オープンデータを中心に無料で利用できるサイトを色々紹介。
…あまりPowerBI関係ないw

1 Data.go

thumbnail
日本のオープンデータカタログサイト。
中央省庁が保有する行財政や経済、環境、観光、気象など、あらゆる分野の統計情報が格納されています。
残念ながら、格納されているデータはすべてが機械判読できるデータではないので注意が必要です。

2 e-stat

thumbnail
政府統計のポータルサイト。
上記Data.goよりもデータ量は豊富です。
ただし、ダウンロードできるデータのほとんどは人が見やすいデータの表示形式。
ETLの技術が試されます。(練習には最適かもw)

3 RESAS

thumbnail
地域経済分析システム、略してRESAS。
地方創生をテーマとして、地方自治体単位の様々なデータが可視化できるサイトです。
本来はブラウザベースで手軽に可視化できることが売りですが、
ビジュアル単位で元データをダウンロードすることも可能です。
こちらでダウンロードできるCSVデータは比較的取り込みやすく整形されています。

4 DATA.GOV

thumbnail

アメリカのオープンデータカタログサイトです。
こちらもデータ読み込みしやすい形式としにくい形式のデータ混在していますが、
日本よりは比較的整備されている印象。
PowerBI関係無いですが、オープンデータ使ったアプリケーションの紹介なんかもあります。


上記までで記載したData.goやe-stat、RESAS、DATA.GOVは、いずれもAPIを提供しています。
手作業でCSVをダウンロードしてもいいですが、操作慣れていればAPI経由のPowerQueryを書いてもいいかもしれません。

PowerBIでAPIを実装する方法は以下記事と、コメントで記載されています。

【PowerBIメモ】RESAS APIとRを使ってデータセットを作ってみる


5 Kaggle

thumbnail
データサイエンス業界では知らない人がいないコンテストサイト、kaggle。
データサイエンティストが腕を競い合い、情報交換をする場ですが、
様々なデータセットが格納されており、アカウント登録をすれば誰でも使うことが可能です。
バラエティに富んだデータを可視化できるのはとても魅力的。

6 DeepAnalytics

thumbnail
日本版のKaggleと言うべきサイト。
Kaggleほどデータセットが豊富ではないですが、サンプルコンテストのデータはいつでもダウンロードできます。

7 UCI Machine Learning Repository

thumbnail

カリフォルニア大学アーバイン校が公開している機械学習用のサンプルデータセット。
おおよそ400のデータセットが公開され、誰でも使用可能になっています。
PowerBIで扱うにはあまり適していないデータもありますが、
多くのデータは、可視化・分析のいい材料になりそう。


おわりに

PowerBIを練習するにはまずはデータの用意から。
MicrosoftのサンプルデータでももちろんOKですが、
自分でデータ選択して可視化してみるのも面白いですね。

なお、ここに記載したサイトのデータ利用にあたっては、各サイトのデータ利用規約等を守ってください。

79
90
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
79
90