コンピュータビジョンのトップカンファレンス(学会)であるCVPR2019で発表された論文をサーベイして、参加者にシェアしようという取り組みを産業技術総合研究所の片岡氏が発起人となり、有志で2015年から行われている。
2019年の報告会に参加したので、自分が受け取った概要を抜粋する。
#代表講演:CVPR の潮流~CVPR2019とその後の動向~
- 発表者 産業技術総合研究所 片岡裕雄氏
Computer Visionの国際的なトップカンファレンスであるCVPRの注目度はここ最近大きくなり続けている。(Deep Learning, AIのトレンドとともに)
強いIT企業の存在感はますます大きくなっている。ポスターの前でも人だかりができる傾向がある。優秀な研究者がスカウトされ、その人を目指して人が集まる?
Google 54本、Sense Time 44本、Facebook 35本の論文を通している。
強い研究機関はその後のトレンドを作る論文を出している。
Computer Vision研究の潮流
今はDeep Learning全盛、その前はHoGやSIFTなどの局所特徴量(点)抽出 → SVMやBoFで識別が主流だった。
2012年のAlexNetの登場以来、Deeep Learningの構造はどんどん深くなり、認識タスクでの精度も向上していった。ResNetなど深くしても学習が進む仕組みが提案されてきた。
画像全体を識別するタスク以外に、画像中に「何」が「どこ」にあるという物体検出、画像中の全ピクセルについてそれぞれ「何」なのかという領域分割、動画や画像と言語を合わせたタスクについても以下のような代表的な研究がある。
GAN(Generative Adversarial Network)は登場以来、研究が活発な分野の一つ。主要な論文に以下のようなものがある。
ImageNetやcifarのような標準的に使われるデータセット以外で画像識別するときには教師データ用の大量のラベル付けが必要になる問題がある。その対策として以下のようなキーワードをもつ研究も広がりつつある。
CVPRのトレンドを作ってきた論文を紹介する。
<img width="1435" alt="CVPRのトレンドを作っている論文1.png" src="https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/178888/e2dea142-374c-c901-b2bd-cd503f950e4e.png">
発表資料のリンク
https://www.slideshare.net/cvpaperchallenge/cvpr-2019
かなり盛りだくさんの内容に見えるが、「現地で得た情報量の数%しか載せられていません。是非皆さん参加しましょう!」という仰っていました。