LoginSignup
330
316

More than 5 years have passed since last update.

画像を扱う機械学習のためのデータセットまとめ

Last updated at Posted at 2018-01-09

マシンビジョン分野で、個人的に使ってみたい気になったデータセットをまとめました。実際に業務で使用する場合は各データセットのライセンス条項をよく確認してください。

英語で検索する場合は、datasets open data image processing machine learning 等で検索するといいと思います。

検索で引っかかったマイナーなものを重点的に調べました。

ImageNet

2009年のCVPRにてプリンストン大学のチームが公開したのがきっかけで発展した、1400万枚超の画像と意味を示すタグのデータセットです。100万枚ほどはバウンディングボックスのアノテーション付きです。

http://www.image-net.org/
タグを検索するとこのように画像の一覧と配下のキーワードが表示されます。これだけでも楽しい。
2018-01-09_17-32-07_ImageNet Tree View 🔊(1).png

あまりに膨大な量なので一括ダウンロードはではなく、ダウンロードURLを取得して必要なものだけダウンロードする形になると思います。ググるとダウンロードの方法が沢山見つかります。

Open Images Dataset

オープンデータとなっている画像に対して、Googleによってバウンディングボックスのアノテーションがつけられたデータセットです。
https://github.com/openimages/dataset
ライセンスは、画像はCC BY 2.0、アノテーション情報はCC BY 4.0とあります。

Food-101

スイスのチューリッヒ工科大学のコンピュータビジョン研究チームが公開しているデータセットです。
クラス分けのタグ情報が付加された食べ物の画像です。5GBの一括ダウンロードです。
https://www.vision.ee.ethz.ch/datasets_extra/food-101/

CIFAR-10 / CIFAR-100

あのAlexNetのAlex Krizhevsky氏のグループが公開しているデータセットです。
10クラス分類と100クラス分類の画像データセットです。
http://www.cs.toronto.edu/~kriz/cifar.html

PASCAL VOC

アノテーション付きの画像データセットです。
http://host.robots.ox.ac.uk/pascal/VOC/

2005年から2012年まで精度を競い合うコンペのためのデータセットが配布されており、それぞれデータセットが今でもダウンロード可能です。
2018-01-09_17-24-46_PASCAL VOC2011 Example Images.png

COCO - Common Object in Context

セマンティックセグメンテーション情報(いわゆるアノテーション/ラベリングよりも詳しい、画素レベルでの物体認識情報)が付加されたデータセットです。

http://cocodataset.org/
2018-01-09_17-42-51_COCO - Common Objects in Context.png

KITTI Vision Benchmark

ドイツのカールスルーエ工科大学とアメリカ・シカゴにある豊田工業大学シカゴ校のチームによる、自動車ビジョンのための画像データセットです。
http://www.cvlibs.net/datasets/kitti/
動画がよりわかりやすいです。自動車を取り巻くあらゆる環境情報が同梱されているようです。
https://youtu.be/KXpZ6B1YB_k

Daimler Urban Segmentation Dataset

Cityscapesの元になったデータセットでしょうか。都市画像のデータセットです。
http://www.6d-vision.com/scene-labeling
https://youtu.be/W3KALabTY64

Cityscapes dataset

ドイツのダイムラー社、マックス・プランク研究所、ダルムシュタット工科大学のチームが公開しているデータセットです。
ドイツの50都市の画像にセマンティックセグメンテーション情報と距離情報が付加されたデータセットです。
自動運転系ではこの中では一番新しいようです。

Flickr Logos dataset

http://image.ntua.gr/iva/datasets/
アテネ工科大学のThe Image and Video Analysis(IVA)チームが提供するデータセットです。

ロゴのデータセットは矩形のアノテーション付き
http://image.ntua.gr/iva/datasets/flickr_logos/
2018-01-09_16-38-22_Flickr Logos dataset  IVA.png

他にも、300万枚以上の世界中、またはヨーロッパの都市の写真がジオタグ付きで提供されています。

DAGM 2007

http://resources.mpi-inf.mpg.de/conferences/dagm/2007/prizes.html
ドイツのシンポジウムで開催されたコンペ用のデータセットです。
工業用部品の表面の欠陥を検出するという目標で、基本画像1000枚と人工的につけられた欠陥を含む150枚の画像が含まれています。

2018-01-15_14-10-58_DAGM 2007.png

The GRIMA X-ray database

チリ・カトリック大学工学部教授のDomingo Mery氏の研究室Webサイト。
GRIMAというのはチリ・カトリック大学コンピュータサイエンス学部の機械知能グループの略称だそうです。

約2万枚の5つのカテゴリ(鋳物や溶接など)に分けられた工業製品のX線画像が含まれています。
http://dmery.ing.puc.cl/index.php/material/gdxray/

LV SEGMENTATION CHALLENGE

3Dセグメンテーションのデータセット
登録が必要です。

楽天データセット

楽天が公開しているデータセットです。大学及び公的研究機関向けで利用には登録が必要です。
画像以外のものがほとんどですが、レシピ画像やEC商品画像、アノテーション付き文字画像なども含まれています。

https://rit.rakuten.co.jp/data_release_ja/
https://www.nii.ac.jp/dsc/idr/rakuten/rakuten.html

データセットのまとめ記事(+おまけ)

この記事はおそらく今後更新されませんが、以下のまとめならどんどん新しい情報が入ってくるかもしれません。

330
316
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
330
316