ScribbleSup: Scribble-Supervised Convolutional Networks for Semantic Segmentation
segmentationタスクのためのデータ作りは高コストである。
一方、正確ではない走り書きのようなアノテーション(scribble)は良く使われる低コストなラベル方法である。
本論ではそうしたラベル方法をsegmentationデータラベリングへ応用し、そんもデータによりCNNの学習を行う。
提案手法は物体の一部へ走り書きでアノテーションされた部分より、グラフモデルに基づいてピクセルレベルのラベル伝搬をラベルされていないピクセルへ行っていく。
また草原、水、空といった明確な境界が定義されていない物体に関しても効果的に働く。
ReSeg: A Recurrent Neural Network-based Model for Semantic Segmentation
Structured prediction問題において、局所的な関係をCNNで、遠い関係においてRNNを用いて学習するモデルを提案する。
このモデルはReSegと呼び、最近提案されているReNetをベースにしている。
ReNetは4つのRNNから成り立ち、画像の縦と横において双方向に走査する事で、全所的な特徴を抽出している。
本論ではこのReNetをCNNによる特徴抽出の上に導入する事で、さらにCNNで得られる局所特徴を活用する。
このモデルは様々なsegmentation問題において有効である。
An Infinite Restricted Boltzmann Machine
隠れ層の次元数を設定する必要のないRBMモデルを数学的に構築する。
実際は、隠れ層の次元数は適応的に増えていくように設計している。
これは各隠れ因子をどのような並べるかに関してsensitiveのした事による。
またエネルギー関数を慎重に選択した事で、無限次元においてもwell-definedにできた。