Building Deep Networks on Grassmann Manifolds
Grassmann manifoldは少ないサンプルの画像や動画の認識タスクにおいて、そのデータ表現の手法として用いられる。
本論ではこの多様体表現上におけるdeep neural net構造を提案する。
この構造では、grassmannian inputに対して、それをより望ましい特徴表現に変える層、それをさらに正規化する層、Grassmannian contextに対応したmodel complexityを低減させる層、そして最後の出力されたGrassmaninan表現を通常のユークリッド表現に変える層、を持つ。
このモデルは多様体に対応したstochastic gradient descentを用い、また行列に一般化した誤差伝搬を利用することで構造的なデータにも対応可能になる。
PolyNet: A Pursuit of Structural Diversity in Very Deep Networks
CNNにおいてその幅と深さを増やしていく事は性能向上へ有効である。
しかし深さを増やしすぎると勾配情報の逓減と学習の困難化、幅を増やすと二次関数的にモデルサイズが増加するなどの問題がある。
本論ではこの問題を回避するために新たな軸としてstructrual diversityに基づいたモデル拡張を提案する。
ここでは、polyinceptionと呼ばれるモジュールを導入する。
この構造は単独で、あるいは他の構造の代替としてネットワークは入れ込む事ができる。
polyinceptionを用いる事で、計算コストを抑えつつも表現力を向上させる事ができる。
Combinatorial Energy Learning for Image Segmentation
画像に条件付けられたセグメンテーションのconditional energyをモデル化するニューラルネットによるsegmentation手法を提案する。
Combinatorial energy learning for image segmentation (CELIS)は、dense image segmentation問題の持つ組み合わせ問題的な側面にフォーカスを当てる。
提案モデルは、エネルギー関数をモデル化し、このエネルギー関数をsupervoxel agglomeration空間において局所最適化を行う。
本モデルはグラフベースの従来手法よりも高性能になった。