ILSVRCは2010年から始まった大規模画像認識の競技会です。
現在は参加しているチームの殆どがDeep Learningを使用しており、
画像認識Deep Learningの大きな競技会と言えます。
ILSVRCとDeep Learning
2012年のILSVRCでHinton先生のチームがDeep Learningで圧勝し、注目を浴びました。
(コンマ何%の精度を競い、人力での細かいチューニングの勝負となると思われていましたが、Task1とTask2で2位以下を10%以上引き離して勝利しました。)
Deep Learningで圧倒的に勝利したことで、画像認識の方向性を決定づけたものと言えます。
画像認識の今後
2015年にはILSVRCの結果で人間の認識性能を超えました。
これは、画像関連の事象について、人間が識別困難なものでも認識可能ということを意味し、例えば、将来的に医学診断で人間よりも効果のある診断ができることを意味していると考えられます。
これは様々な応用が可能であり、今後よりDeep Learningが重要となっていることを意味しています。
ILSVRC2016
ILSVRC2016の内容を幾つか説明します。
詳細は以下を参照ください。
http://image-net.org/challenges/LSVRC/2016/
位置特定(Object localization:LOC)
画像がどこに写っているか?
学習データ:120万画像 1000カテゴリ
テストデータ:15万画像 1000カテゴリ
画像に複数の物体があり、その画像には場所とラベルが設定されており、その中の1つが正解として設定されている。
回答者は5個回答ができ、正解と合っていればよい。
以下であれば、Steel drumが正解として設定されており、回答の5個の中に場所とラベルがあっているものが含まれていれば良い。
(Drumではなく、Steel drumと回答することが求められており、1000カテゴリの分類と位置特定の両方が必要となる)
(イメージ元 http://www.image-net.org/challenges/LSVRC/2013/slides/ILSVRC2013_12_7_13_clsloc.pdf)
2016年はTrimps-Doushen(中国公安局)というチームが勝利しています。
物体検出(Object detection:DET)
画像に何が写っているか?
200個のカテゴリーの内、何個のカテゴリーを検出できるかを競う
以下がサンプルです。
(イメージ元 http://image-net.org/challenges/LSVRC/2014/ui/det.html)
2016年はCUImageというチームが勝利しています。
間違っているところがありましたら連絡をお願い致します。