Subcategory-aware Convolutional Neural Networks for Object Proposals and Detection
CNNベースの物体検出では,scale variation, occlusion, truncationの影響によりregion proposalの部分が難しくなってくる.
また従来手法は2Dの物体検出のみを行い,検出された物体の詳細についての予測は行わない.
本論でsubcategory-awareなCNNを物体検出のために提案する.
提案するregion proposal networkでは対象のサブカテゴリ情報も用いたproposal genereting processを提案する.
Laplacian Pyramid Reconstruction and Refinement for Semantic Segmentation
CNNは画像認識タスクにおいて高い性能を発揮してきた.
しかしそのためにはpooling機構へ頼る必要があり,高解像度な画像に対するpixelレベルの推論は難しくなっている.
本論では特徴抽出の過程において低解像度になったとしても,それら特徴は対応する位置に関するpixelレベルの情報を保持している事が分かった.
またlaplacian pyramidの構成を利用したマルチ解像度の再構成を行い,そこに高解像度特徴からのskip connectionを利用する事でpixelレベルの推論精度を改善させる.
OUTRAGEOUSLY LARGE NEURAL NETWORKS: THE SPARSELY-GATED MIXTURE-OF-EXPERTS LAYER, ICLR2017
Neural networkのキャパシティはそのパラメータの数に制限される.
ネットワークの一部のみをサンプル毎に活性化させるconditional computationはネットワークの計算量を増加させる事なくキャパシティを上げる事が出来る理論として最近提案されてきている.
しかしながら,パフォーマンス面とアルゴリズム面においてその実現において課題は残っている.
本論ではそれらを解決し,計算効率に関する微小な損失のみで1000倍のmodel capacityを実現する事を可能にした.
そのための手法として本論ではsparsely-gated mixture-of-experts layerを提案する.
この構造は最大で数千の層から成り立たせる事が出来る.
搭載されている学習可能なgated networkはサンプル毎に利用するネットワークを自動的に選択する事を可能にする.