SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient, AAAI
シーケンスデータに対するGANモデルは基本的に実数データに対するものであり、テキストデータをはじめとする離散データに対応したものはなかった。
主な問題としては、discriminativeモデルで得られる勾配情報を、generativeモデルに与えてgenerativeモデルを少しずつ更新する場合に、訓練データに辞書に含まれない情報があった際に効果をなさない事である。
また損失はシーケンス全体に対して計算されるため、generativeモデルから得られた部分的なシーケンスに対する損失をどのように計算するかも問題になる。
本論ではgenerativeモデルを強化学習におけるagentとみなして逐次的な決定過程として考える。
利得は例えばBLEUなどの問題特化な指標を用いるのではなく、discriminativeモデルを用いて利得を返す。
stochastic parametrized policyを用いる事で、モデルを確率的に扱い、今までにないような情報に対する勾配も活用可能にする。
またpolicy gradientに基づく学習を用いる事で離散データにおけるモデル更新を可能にした。
Equality of Opportunity in Supervised Learning
特定のセンシティブな属性情報に関するdiscriminationにおける指標を提案し、それに基づく教師あり学習を提案する。
具体的には、学習されたモデルに対し、それらセンシティブな属性情報に対するdiscriminationをなくすような調整を加える。
これは結果的に無意味な判別をなくし、より良い結果を生み出す。
Fast Memory-efficient Anomaly Detection in Streaming Heterogeneous Graphs
コンピュータネットワーク上のデータに見られるような、各サンプルが異なったグラフ構造を持つようなデータストリームに関する異常検知を考える。
ここでは類似度指標を、2つのグラフ間でどれくらいの頻度で同じ局所構造が現れるかを元に、定義し、これに基づいて異常検知を行う。
各局所構造はstringを用いて表され、それに基づきグラフ全体は高速演算が可能なベクトル表現へ変換される。
またメモリ制約に応じて要約的なデータだけを保持するsketchingも行う。