機械学習
MachineLearning
論文読み

機械学習論文読みメモ_113

Residual Attention Network for Image Classification
画像分類のためのネットワーク構造として、
attention構造を持ったresidual networkを提案する。
この構造は、ネットワークが深くなるに連れ、attentionする場所が適応的に変化していく。
またattention構造内にsegmentationなどで良く使われる、低解像度化・抽象化するbottom-upと高解像度化・具体化するtop-down構造を使う事でattention maskを獲得するようにしている。

CASENet: Deep Category-Aware Semantic Edge Detection, CVPR2017
画像認識の様々のタスクにおいて、境界検出は重要な役目を果たす。
従来の境界検出は、境界であるかどうかの二値予測であったが、
本論ではcategory aware、つまりその境界が属する潜在クラスも同時に判別する事を考える。
これは境界が複数のラベルに属する事が可能なため、multi class label問題として考えられる。
本論ではend to endなネットワークによりこのタスクを学習する。
提案ネットワークはresnet basedであり、top layerから得られた分類結果とbottom layerの特徴
を組み合わせた特徴表現を用いて最終的な結果を出す。

Network Dissection: Quantifying Interpretability of Deep Visual Representations, CVPR2017
CNNの潜在表現の理解するためのフレームワークとしてNetwork Dissectionを提案する。
この手法は意味コンセプトと隠れユニットを対応させる事を可能にする。
そのユニットは対応する対象の範囲に対して関連付けられ、可視化する事が可能である。
また理解可能な表現は特徴空間の各軸上に沿って現れるため、回転によって理解可能な表現が軸上より失われる事がわかった。
また様々なネットワークにおいて得られる表現の違いについても比較した。