機械学習論文読みメモ_106 #機械学習

Understanding Black-box Predictions via Influence Functions
本論ではロバスト統計などの分野で用いられるinfluence functionを用いたブラックボックスモデルの予測結果を説明する手法を提案する．
Influence functionを用いる事で訓練データサンプルの微小変化が学習されるモデルのパラメータへどのような影響を与えるかを分析する．
これによりどのサンプルが最も現在の解析したい予測に対して影響を与えているかを知る事が可能になる．
本論では特に，現在の複雑な機械学習モデルへも適用可能にするために，新たな手法を提案する．
この手法はgradientとhessian-vector productへのアクセスさえあれば利用可能になっている．

A Connection Between Generative Adversarial Networks, Inverse Reinforcement Learning, and Energy-Based Models
GANアプローチはdiscriminatorによって学習されたコスト関数を最適化する事で生成モデルを学習する手法である．
生成モデル学習においては，コスト関数の学習は新しいが，制御や強化学習の分野においてはそれは長い間研究がなされてきた．
特にそれは例えばimitation by demonstrationのタスクである．
このような分野においてはinverse reinforcement learningやinverse optimal controlと呼ばれる分野で研究がなされている．
実際いくつかのIRL手法においてはそれはGANと数学的に等価である事が言える．
特にmaximum entropy IRLに対しては，GANにおいて生成モデルの分布が判別モデルのもう一つの入力，また評価にも用いる事に使われる場合において同じになる．
また興味深い事にmaximum entropy IRLはenergy based modelの特別なケースであるため，そことの関連も言える．
本論ではenergy based modelとGANとの理論的関係においても探索を行った．

Cognitive Mapping and Planning for Visual Navigation
新しい環境におけるnavigationを実現するためのネットワークを提案する．
提案するネットワークは主観視点のカメラから地図を作成する．
そしてその環境におけるゴール地点へ到達するための行動シーケンスを計画する．
この提案するcognitive mapper and planner (cmp)では，mappingとplannerを組み合わせた構造を提案し，これによりmappingはplannerのニーズに基いて行われる．
planningが可能な空間的メモリを不完全な観測から構築する．
cmpはtop downなbelief mapを持ち，plannerはそれに基いて行動を決定する．