Posted at

機械学習論文読みメモ_126

More than 1 year has passed since last update.

Meta Learning Shared Hierarchies

階層的のpolicy構造を学習するためのmeta-learning手法を提案する。

この時に様々なタスクに共通して用いられるpolicyを共有して使う条件を加える事でsample efficiencyを改善した。

この事実は一般的な強化学習の最適化手法を用いる事で実験的に示せた

Progressive Growing of GANs for Improved Quality, Stability, and Variation

GANの新たな学習手法を提案する。

提案手法では、generatorとdiscriminatorを学習の過程で順々に大きくしていく。

つまり、最小は低解像度の画像を用いてGANを学習し、その学習されたモデルに対し

高解像度化を行う層を追加し、それに合わせた解像度の画像を用いてモデルを学習していく。

このプロセスを経る事で学習を高速化し、さらに安定させる事も出来る。

結果高解像度の画像に対するGANで高性能な結果を出す事が出来た。

Distributed Prioritized Experience Replay

分散型の強化学習を考える。

この枠組みでは大きなスケーラビリティの改善が見込める。

提案手法ではactorをlearningから切り離す。

actorは共有されたネットワークを利用し与えられた環境とやり取りをする。

そして得られた経験は共有されたexperience replay memoryへスタックされる。

この構造ではprioritized experience replayを用いる事で重要なデータに集中を行う。