CNN-AWARE BINARY MAP FOR GENERAL SEMANTIC SEGMENTATION, ICIP2016
CNNのsemanticsを利用した一般的なsemantic segmentation手法を提案する。
提案手法はCNNから得られる特徴量をバイナリ化する事で高次元空間上で分類をしやすくする。
得られるバイナリ特徴はロバストであり、ノイズや無関係な変化に強い。
このもバイナリ化処理はCNNの最後の追加レイヤーとして扱う事でオンラインセグメンテーションまでを実現する。
Hybrid computing using a neural network with dynamic external memory, Nature
従来のコンピュータにおけるrandom access memoryとanalogousなNN構造として、マトリックス構造の外部メモリに対して書き込みと読み込み機能を持ったNNモデルを提案する。
このメモリ構造を用いる事で、従来のコンピュータと同様に複雑なデータ構造、表現を扱う事が可能になる。
しかし従来とは違い、そうしたデータ構造、表現をデータから学習する事が可能になる。
学習は教師あり学習、あるいは強化学習によって可能である。
AMORTISED MAP INFERENCE FOR IMAGE SUPER-RESOLUTION
超解像問題はunderdeterminedであり、複数の高解像画像が低解像画像を説明可能である。
従来はピクセル毎のMSEが用いられてきたが、性能はあまり高くない。
より好ましい手法としてMAP推定に基づく手法がある。
MAP推定の場合、高解像画像に関する事前分布に基いて、事後分布最大となる画像が選ばれるため、より妥当な画像を生成可能である。
しかしながら、これはいかに事前分布を選ぶかに依存し、データサンプルからそれを直接推測する事は難しい。
またMAP推定は逐次最適化による手法が良く用いられるが、これは昨今のNNベースの手法と比較すると性能で劣る。
本論では、代わりにCNNを用いる事で直接MAP推定を行う手法を提案する。
CNNは与えられた低解像画像と一貫性を持った高解像画像集合に関する部分空間へ写像を行う。
このCNNを用いると、MAP推定は、CNNによる生成モデルとサンプル分布との間のクロスエントロピー最小化問題として置き換わる。
この問題を解くにあたり、GAN、denoisingに基づく手法を提案する。