1. 概要
データやサンプルがモデルが学習したデータの範囲外にあることを”out-of-data”問題と言い、例えばモデルが学習したデータ分布の範囲外にある画像を生成することが難しいことが挙げられる。この論文では、Representation Leaning(表現学習)において、データから特定の特徴を見つけ出す存在変数の同定処理を提案しており、"out-of-data"に対応した学習データに含まれていない画像の生成を実現している。
*Oral Paper
2. 新規性
特定クラスのデコーダーを”Additive”(加算可能な)ものとして扱い、これを用いて潜在変数の同定と画像生成が可能であることを示している。これらのデコーダーは、”Object-Centric Representation Learning(OCRL)”(物体中心の表現学習)に用いられるデコーダーと類似しており、一枚の入力画像をオブジェクトごとの小さな画像の合計として分解できると考える。提案手法では、特定の条件下で潜在変数の同定を確実に行えることを示しており、その条件も弱い仮定しか必要としない点が新規性にもなっている。
3. 実現方法
”Additive Decorders”(加算可能なデコーダー)を提案しており、これを使って画像を個々の物体に分解して再構築する問題を解く。潜在変数のブロックをブロックごと画像へと逆変換可能な状態でデータ分布を同定できる。潜在変数の分布については非常に弱い制約しか必要としないので、その分布が統計的な依存関係を保持しており、ほぼ任意の形状に対応できる。
また、提案手法である”Additive Decorders”は、観測された変動の要因をブロックごと直接組み合わせることで、学習データに存在しなかった新たな画像を再構成できる能力を持っていることを示しており、これを”直接外挿”と呼んでいる。
4. 結果
提案手法はシミュレーションされたデータにおいて、潜在変数の同定と外挿の両方において有効であることを示している。特に、学習データに含まれていない分布のデータをデコーダーで加算的に補えるという新しい発想が功を奏している。
Paper URL: https://openreview.net/pdf?id=R6KJN1AUAR
last updates: Dec 25 2023