機械学習論文読みメモ_123 #機械学習

Real-Time Adaptive Image Compression
本論では損失ありの画像圧縮手法について、機械学習に基づく手法を提案する。
この手法はリアルタイムで、かつどの既存の圧縮手法よりも圧縮効率が良い。
この手法はautoencoderにインスパイアされたpyramid型の特徴抽出を行う。
またモジュールとして量子化したデータに応じたencodingとcodelengthの調整を行う
Adaptive codingとexpected codelength regularizationが存在する。

Unsupervised Pixel-Level Domain Adaptation with Generative Adversarial Networks
ラベル付けを要求することなくdomain adaptionを行う手法を提案する。
こうした手法は主に、２つのドメイン間のマッピングを学習させる事を通して
実現する。
本論ではこれをGANに基づくアプローチを用いることで実現する。
この手法ではsource domainの画像をあたかもtarget domainの画像かのように変換する
タスクを学習する。
この手法でシミュレーションで作成した画像を現実的な画像へ変換する事を可能にする。

Generalization in Deep Learning
Deep learningモデルの理論研究は長く行われてきた。
まず表現力に関して言えばuniversarityが以前より示されており、
手製の特徴に対して指数的なアドバンテージがある。
一方学習可能性に関してもnon-convexityの枠を超えた特性が発見されている。
今回扱うgeneralizationに関しては、従来deep netは予測に関して良い性能が出せず、
学習データに過剰適合しやすい事が知られており、そこから汎化性能に関する研究
がさかんに行われてきた。
compact表現の文脈においては、ある一定の仮定を満たすクラスはそれを満たさないものと比較して
高い汎化性能を持つ事が分かっている。
しかし一方で、成功しているdeep netモデルは多くがランダムなラベルを全て記憶可能なキャパシティ
を持っており、汎化性能が高いとは言えない。
この現象はapparent paradoxという名で知られている。
本論ではこの現象の説明を試み、それを通してなぜその不安定性、頑健性のなさ、
記憶容量の大きさにも関わらず成功しているdeep netが存在するのかを説明する。