機械学習論文読みメモ_149 #機械学習

Augmented CycleGAN: Learning Many-to-Many Mappings from Unpaired Data
unpairedなデータ間のドメイン変換の学習はimage segmentationを始めとするタスクの性能を向上させる
事ができる。
CycleGANはそうした学習手法の一つであるが、一対一対応を仮定する必要があった。
しかし実際のタスクにおいては、ドメイン間の関係は多数対多数の関係において特徴
つけられる事が多い。
例えば、一つの靴のシルエットから、複数のスタイル表現を生成したい場合などである。
そのためこの仮定は多数対多数の変換を行いたい場合に非効率になってしまっていた。
本論で提案するAugmented Cycle GANはそうした多数対多数の変換を学習可能な手法である。
この手法は、各ドメインに関して潜在変数を導入する。
この潜在変数はドメイン内の多様性を学習するために使われる。

SalientDSO: Bringing Attention to Direct Sparse Odometry
雑然としたindoor sceneは多くの高レベルなsemantic情報を持つにも関わらず、
VOを始めとする従来手法は点、線、面などの幾何学的特徴のみを用いて
推論を行ってきた。
こうした背景において最近、高レベルなsemantic情報と幾何的特徴の双方を
利用した手法が注目を集めてきた。
しかし双方の特徴に関して同時に最適化を行う手法は高性能だが推論に時間がかかる
問題があった。
一方で従来のdirectでsparseなVOは性能と速度の良いバランスを保った手法を提案できている。
本論ではそうしたVOの一つであるDSOにsemantic情報を取り入れたSalientDSOを提案する。
この手法はsemantic情報からvisual saliencyを抽出して、ソフトなattentionを可能にする。
これにより、少ない数の特徴抽出でDSOが可能になる。

In-Place Activated BatchNorm for Memory-Optimized Training of DNNs
Deep learning計算の効率を向上させる手法としてInPlace-ABNを提案する。
この手法は、従来よく使われる連続した層構造としてあるBatchNorm + Activationを
一つの層に代替する。
これはパラメータを減らし、中間表現の保存を回避する事を可能にする。
一方で従来よく使われるcheckpointingを用いた計算効率化もInPlace-ABNと同程度の
効率を出す事ができる事を示す。
しかしこれは実装が複雑化するため、InPlace-ABNを用いる事の有用性は保たれている。