はじめに
本来、論文や数式を全く読めない私が、論文内の図示だけを見て、 「これは凄そうだ!」 と直感的に感じてワクワクしたため、メモとしてココに残す。
あまりのワクワク感から論文の全文を日本語に翻訳したが、著者に無断で翻訳後の論文を公の場で公開することや図示を引用することは著作権に抵触するらしいので、この場では公開しない。
あくまで個人の趣味利用でPrivate Gitなどを利用してワキワキ楽しむだけのレベルとする。
読み込んだ論文
AMCL 2018で発表された論文。
http://www.acml-conf.org/2018/ACML%202018%20Main_Home.html
RDEC: Integrating Regularization into Deep Embedded Clustering for Imbalanced Datasets
http://proceedings.mlr.press/v95/tao18a/tao18a.pdf
Yaling Tao yaling1.tao@toshiba.co.jp
Kentaro Takagi kentaro1.takagi@toshiba.co.jp
Kouta Nakata kouta.nakata@toshiba.co.jp
Corporate R&D Center, Toshiba Corporation, Kawasaki, Japan
Editors: Jun Zhu and Ichiro Takeuchi
ポイント
- 不均衡データのための正則化ディープエンベデッドクラスタリング (RDEC)
- 不均衡なデータのごく少数派のクラスに適切な重心を置いて、物凄くうまく分類できる
- クラスタリング手法
- ディープラーニングとの組み合わせ
- 正則化項あり
- 2018.11 時点で最高のパフォーマンス (state-of-the-art)
- 異常検知分野で猛威を振るうに違いない
- 私に機械学習の実装スキルがあれば即座に再現実装してみたいのですが。。。数式読めない時点でかなりダメね。。。
- MNISTデータセットによる分類精度は
98.41%
、 MNISTから派生した非常に不均衡なデータセットによる分類精度は85.45%
で、現在の最善の結果よりも8%
近く高い - 日本語訳を公開してもいいか? なんて、TOSHIBAさん相手に聞く勇気なんて全く無いです。。。
おわりに
せめて私に力があれば。。。