先日、異常検知モデル用のデータセット一覧を記事にしましたが、今回は、自分がよく学習や評価に使う画像分類モデル用のデータセットをまとめてみました。
画像分類データセットも(自分で画像を加工すれば)異常検知モデル用のデータセットとして使えるので、個人的には、けっこう重宝してます。
画像データセット一覧
異常検知タスク(2クラス分類)
MVTec
論文のベンチマークとして、よく利用される異常検知用の画像データセット。
ADFI
最近公開された異常検知用の画像データセット。サイトは日本語なのでわかりやすい。
分類タスク(多クラス分類)
CIFAR-10、CIFAR-100
非常に有名な画像データセット。画像サイズが小さい(32×32ピクセル)ので(計算時間が短くなるため)使いやすい。
CIFAR-10は10クラス。CIFAR-100は100クラス。
ImageNet
非常に有名な画像データセット。データサイズが大きすぎるのと、フルバージョンをダウンロードするためにはログインが必要なのが難点。
1000クラス。
MNIST
非常に有名な手書きの数字(0~9)の画像データセット。28×28ピクセルのグレースケール画像なのでデータサイズも小さく、使い勝手が良い。
10クラス。
Fashion-MNIST
MNISTと同じ条件(28×28ピクセルのグレースケール)の服や靴などの衣類の画像データセット。「MNISTだとタスクが簡単すぎる」という人向け。
10クラス。
Office-31
テレビや自転車などの家具や日用品の画像データセット。元々、Domain Adaptationタスク用に作られたデータセットのため、3つのドメイン(Amazon、DSLR、Webcam)に分かれている。
31クラス。
Food-101
様々な料理の画像のデータセット。
101クラス。
FoodX-251
様々な種類のパスタなど、分類の難しい料理の画像データセット。
251クラス。