機械学習論文読みメモ_75 #機械学習

Discrete Variational Autoencoders
離散変数を含むような確率モデルを用いる事で離散データを扱う事が可能になる。
しかしながらそうしたモデルを学習する事は困難である。
これは、離散モデルにおけるback propagationが難しい事に起因する。
本論で提案するネットワークは、離散変数に対して無向グラフ、連続変数に対しては有向グラフを用い、これをvariational autoencoderの枠組みで学習を行う。
この中では、離散変数は、互いに非連結な連続変数で表現される各多様体への対応を示す事になる。
このモデルを利用する事で、クラスと画像のセットを教師なし学習の枠組みで学習し、それらの対応を学習する事が可能になる。

High Dimensional Human Guided Machine Learning
人間が特徴抽出・選択を行った特徴データと、オリジナルデータを直接用いたXGBoostによる学習結果を比較した。
結果、人間が作成したデータを用いた場合が性能は低くなったが、ほぼ迫るような結果が得られた。
これは人間が作成したデータを援用した高次元データ学習に対して指針を与える。

Law of Large Graphs
サンプルに基いて平均のグラフ構造を推定する事はネットワークサイエンスにおいて重要である。
しかしながら、推定すべきパラメータ数に対してサンプルサイズが少ない事が問題になりがちである。
一般に隣接行列の要素平均が従来使われているが、グラフの構造そのものを考慮しないため課題がある。
本論では、この手法の上にさらに低ランク仮定を置く事で、この問題へ対処する。
理論解析の結果、この手法を用いると、verticeの数が多い場合に、改善幅が大きい事が分かった。