Inverted Residuals and Linear Bottlenecks: Mobile Networks for Classification, Detection and Segmentiaton
本論では様々なモデルサイズのmobile modelにおいて複数のタスクでSOTAを達成可能なモデルとして
MobileNetV2を提案する。
またこの構造をobject detectionに適用したフレームワークとしてSSDLiteを提案する。
また同様にDeepLabv3へ適用したフレームワークとしてMobile DeepLabv3も提案する。
従来resnetで用いられるchannel方向がexpandedされたrepresentationによる入出力ではなく、
よりthinなbottleneck structureを入出力に持つinverted residual structureをMobileNetV2は採用する事で
Residual connection時に少ないchannel数を維持できる。
またlight weightであるdepth wise convolutionを採用している。
さらにnarrow layerにおいて非線形性をなくした事でその表現力を損なう事を防げる事を
発見した。
Learning Deep Features for One-Classe Classification
One class classificationにおけるdeep learningベースの特徴学習手法を提案する。
提案モデルはCNNに基づき既知クラス間の距離を最大化するような表現力の高い特徴空間を学習させつつ、
さらに学習時にクラス内におけるサンプルの分散を低く抑えるようにする。
本論ではこの2つの目的に対応した2つの損失関数を提案する。
Self-Supervised Intrinsic Image Decomposition
画像をいくつかの影や色合いといったinstrinsicに基づいて分解する
Intrinsic image decompositionを扱う。
この問題は曖昧性が強いため困難なタスクである。
本論では入力画像を説明する事を目的においた学習をする事で
intrinsicを抽出する手法を提案する。
提案するモデルは、画像の反射、形状、影などの予測を行う事ができる。
再構成誤差を用いた目的関数を設定する事でself-supervisedな学習を可能にする。