Collaborative Multi-View Denoising, KDD2016
multi-view learningにおいては、2種類のノイズが問題になる。
1つは、intranoiseもう一つはinternoiseである。
これらノイズを除去する事は重要だが、各view間の異質性がそれを難しくしている。
本論で提案する手法はこの問題に対し、各viewから均質な高次元空間への写像を考え、各viewの情報をそれぞれ埋め込んでいく。
さらに半教師あり学習を用いる事で2つのノイズ除去を効率よく行う。
PixelNet: Towards a General Pixel-Level Architecture
ピクセルレベルの予測モデルに関する一般的なモデルを提案する。
これは、エッジ検出から、表面検出、セグメンテーションまでを包括的に扱う事ができる。
FCNを始めとする従来手法は、畳込み構造を利用して空間的情報を冗長性を持って抽出する事により、セグメンテーションを行う。
しかしこの手法は近傍ピクセル間で抽出可能な情報量を制限してしまうデメリットがある。
本論で提案するモデルでは、stratified sampling(カテゴリ割合を意識したサンプリング)を用いる事でバッチ学習における多様性の確保を行う。
またマルチスケールに特徴抽出を行う事で非線形構造を効率良く抽出する。
Deep Pyramidal Residual Networks
CNNはプーリングによってダウンサンプリングを行うと共に、特徴量を増加させ表現力を向上させる。
本論では、プーリングによって特徴量を飛躍的に増やすのではなく、徐々に増やす事で細かく多スケールな空間情報を利用する。
この構造をResNetと共に適用する事で分類性能が向上可能である事を示した。