More than 5 years have passed since last update.

タクトピクセル株式会社

画像を扱う機械学習のためのデータセットまとめ

Last updated at 2019-02-05Posted at 2018-01-09

マシンビジョン分野で、個人的に使ってみたい気になったデータセットをまとめました。実際に業務で使用する場合は各データセットのライセンス条項をよく確認してください。

英語で検索する場合は、datasets open data image processing machine learning 等で検索するといいと思います。

検索で引っかかったマイナーなものを重点的に調べました。

ImageNet

2009年のCVPRにてプリンストン大学のチームが公開したのがきっかけで発展した、1400万枚超の画像と意味を示すタグのデータセットです。100万枚ほどはバウンディングボックスのアノテーション付きです。

http://www.image-net.org/
タグを検索するとこのように画像の一覧と配下のキーワードが表示されます。これだけでも楽しい。

あまりに膨大な量なので一括ダウンロードはではなく、ダウンロードURLを取得して必要なものだけダウンロードする形になると思います。ググるとダウンロードの方法が沢山見つかります。

Open Images Dataset

オープンデータとなっている画像に対して、Googleによってバウンディングボックスのアノテーションがつけられたデータセットです。
https://github.com/openimages/dataset
ライセンスは、画像はCC BY 2.0、アノテーション情報はCC BY 4.0とあります。

Food-101

スイスのチューリッヒ工科大学のコンピュータビジョン研究チームが公開しているデータセットです。
クラス分けのタグ情報が付加された食べ物の画像です。5GBの一括ダウンロードです。
https://www.vision.ee.ethz.ch/datasets_extra/food-101/

CIFAR-10 / CIFAR-100

あのAlexNetのAlex Krizhevsky氏のグループが公開しているデータセットです。
10クラス分類と100クラス分類の画像データセットです。
http://www.cs.toronto.edu/~kriz/cifar.html

PASCAL VOC

アノテーション付きの画像データセットです。
http://host.robots.ox.ac.uk/pascal/VOC/

２００５年から２０１２年まで精度を競い合うコンペのためのデータセットが配布されており、それぞれデータセットが今でもダウンロード可能です。

COCO - Common Object in Context

セマンティックセグメンテーション情報(いわゆるアノテーション／ラベリングよりも詳しい、画素レベルでの物体認識情報)が付加されたデータセットです。

http://cocodataset.org/

KITTI Vision Benchmark

ドイツのカールスルーエ工科大学とアメリカ・シカゴにある豊田工業大学シカゴ校のチームによる、自動車ビジョンのための画像データセットです。
http://www.cvlibs.net/datasets/kitti/
動画がよりわかりやすいです。自動車を取り巻くあらゆる環境情報が同梱されているようです。
https://youtu.be/KXpZ6B1YB_k

Daimler Urban Segmentation Dataset

Cityscapesの元になったデータセットでしょうか。都市画像のデータセットです。
http://www.6d-vision.com/scene-labeling
https://youtu.be/W3KALabTY64

Cityscapes dataset

ドイツのダイムラー社、マックス・プランク研究所、ダルムシュタット工科大学のチームが公開しているデータセットです。
ドイツの50都市の画像にセマンティックセグメンテーション情報と距離情報が付加されたデータセットです。
自動運転系ではこの中では一番新しいようです。

Flickr Logos dataset

http://image.ntua.gr/iva/datasets/
アテネ工科大学のThe Image and Video Analysis(IVA)チームが提供するデータセットです。

ロゴのデータセットは矩形のアノテーション付き
http://image.ntua.gr/iva/datasets/flickr_logos/

他にも、300万枚以上の世界中、またはヨーロッパの都市の写真がジオタグ付きで提供されています。

DAGM 2007

http://resources.mpi-inf.mpg.de/conferences/dagm/2007/prizes.html
ドイツのシンポジウムで開催されたコンペ用のデータセットです。
工業用部品の表面の欠陥を検出するという目標で、基本画像１０００枚と人工的につけられた欠陥を含む150枚の画像が含まれています。

The GRIMA X-ray database

チリ・カトリック大学工学部教授のDomingo Mery氏の研究室Webサイト。
GRIMAというのはチリ・カトリック大学コンピュータサイエンス学部の機械知能グループの略称だそうです。

約2万枚の５つのカテゴリ(鋳物や溶接など)に分けられた工業製品のX線画像が含まれています。
http://dmery.ing.puc.cl/index.php/material/gdxray/

LV SEGMENTATION CHALLENGE

３Dセグメンテーションのデータセット
登録が必要です。

楽天データセット

楽天が公開しているデータセットです。大学及び公的研究機関向けで利用には登録が必要です。
画像以外のものがほとんどですが、レシピ画像やEC商品画像、アノテーション付き文字画像なども含まれています。

https://rit.rakuten.co.jp/data_release_ja/
https://www.nii.ac.jp/dsc/idr/rakuten/rakuten.html

データセットのまとめ記事(+おまけ)

この記事はおそらく今後更新されませんが、以下のまとめならどんどん新しい情報が入ってくるかもしれません。

上海交通大学のXiaming Chenさんのまとめ
https://github.com/caesar0301/awesome-public-datasets#image-processing
画像に限らないのですが、非常によくまとまっています。
mrgloomさんのまとめ
セマンティックセグメンテーションの論文集とデータセットがまとまっています。
https://github.com/mrgloom/awesome-semantic-segmentation#datasets
arXivTimes/datasets
https://github.com/arXivTimes/arXivTimes/tree/master/datasets
主にお二人で更新しているavXiv論文まとめのgithubページですが、datasetのページがすごく充実しているのに驚き。
カーネギーメロン大学のコンピュータビジョンのページ。
http://www.cs.cmu.edu/~cil/v-images.html
2004年から更新が止まっていますがインターネットの黎明期からの更新と思うと興味深い。時代を感じます。
Who is the best at X ?
http://rodrigob.github.io/are_we_there_yet/build/#datasets
データセットではなく、ディープラーニングの分類精度まとめです。各データセットのあらゆる分類手法別の精度が一覧で確認できます。手動で集めたのかな。すごい。
ロシアのinfoculture という会社の創業者であるIvan Begtinさんのまとめ

https://github.com/infoculture/awesome-opendata-rus

338

324

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up