機械学習論文読みメモ_136 #機械学習

PacGAN: The power of two samples in generative adversarial networks
GANのフレームワークは複雑な分布からの現実的なサンプル生成を可能にする。
しかし問題点として、実際は多様なデータに対して学習したにも関わらず、多様性の低いサンプル生成しか
できないという問題がある。
これはmode collaspeとして知られている。
GANにおいてこのmode collaspeが起きる原因と防ぐ方法はまだ良く知られていない。
本論ではこのmode collaspeを防ぐための手法として新たにpackingと呼ばれる手法を提案する。
この手法では判別器は生成された単一のサンプルではなく、バッチに対して判別を行う。
仮説検定の文脈における理論を用いる事で、このpacking手法の利用でmode collapseを
penalizeする事を示す。

Beyond Finite Layer Neural Networks: Bridging Deep Architectures and Numerical Differential Equations
Deepnetに関する一般的な設計ガイドラインはまだ見つかっていない。
本論ではdeepnetのデザインを微分方程式の文脈から解釈することで、
ResNetを含む主要なネットワーク構造が異なった常微分方程式の離散化として捉えられることも示す。
またこの関連性を応用することで、より効率的なネットワーク構造を提案する。
特に、常微分方程式の解法に用いられるlinear multistep methodの考え方を応用する事で
新たな構造を提案する。
Linear multistep methodはResNet構造と相性が良く、ResNetに基づいたネットワークに適用可能である。
結果、提案ネットワークはより高性能かつ少ないパラメータ数を実現する事ができた。

MaskLab: Instance Segmentation by Refining Object Detection with Semantic
本論ではobject detectionとsemantic segmentationを同時に解く技術であるinstance segmentationを扱う。
本論ではこの問題に対して、box detection, semantic segmentation, そしてdirection predictionを行う事が可能なMaskLabと呼ばれるモデルを提案する。
従来手法であるFaster-RCNNによるobject detectorを利用する事で高精度なbox予測を手に入れる。
このboxによるroiに対してMsakLabはforeground/background segmentationを、semantic segmentationとdirection predictionを組み合わせる事で実現する。
semanticはbackgroundを含めた複数の物体を分離するのに使われ、direction predictionは各インスタンスの中心へ向けた方向を予測させる事で、同じクラス内で異なったインスタンスへの分離を行えるようにする。