1. 概要
人間の脳がどのように物事を捉え、脳内の神経結合ネットワークでそれらを結びつけるのかという仕組みについては未だに解明されておらず、”The Binding Problem”(結合問題)として知られる。機械学習を用いてこの問題を明らかにする手法も提案されているが、従来手法では教師なしの設定で主にスロットベースの手法が用いられており、離散的な性質と不確実性を表現する難しさから制約が生じていた。この論文では、"Rotating Features"(回転する特徴)を導入し、複素数値特徴を高次元に拡張し、分散表現から物体を抽出する新しい評価手法を提案している。
*Oral Paper
2. 新規性
従来手法では教師なし手法を用いており結合問題に対して限定的なアプローチだったが、提案手法では物体の特徴量に回転要素を取り入れ学習型にすることで、従来手法では難しかった物体の高次元な表現が可能となった。
3. 実現方法
まず、入力を含むアーキテクチャ全体に対して、1つ次元を追加し”Rotating Features”を特徴量として表現できるようにする。ここで、”Rotating Features”の大きさ(m)が特徴の存在を表し、その方向が物体のクラスを表す空間を用いる。mを用いて物体形状を再構成させるように学習させる。
学習後に未知の物体を入力として、回転特徴空間上で正規化、クラスタリングを行い、回転特徴をある範囲で分けるとそれが物体ごとのセグメンテーション結果になっている。
4. 結果
実世界の物体に対しても回転特徴を用いたセグメンテーションが有効であることを示しており、Toy Examplesだけでなく現実世界にも適用可能な手法となっている。
不確実性を持つような分類が難しいシーンに対しても、その領域を推定して表現に含めることができている。
従来手法であるスロットベースな方法は、物体数が増えると精度が劇的に落ちる傾向があったが、提案手法では未知の物体に対する認識性能が物体数に対して頑健になっている。
Paper URL: https://openreview.net/pdf?id=fg7iyNK81W
last updates: Dec 25 2023