Deep Transfer Learning for Cross-domain Activity Recognition 要約

読んだ論文

Deep Transfer Learning for Cross-domain Activity Recognition
Jindong Wang, Vincent W. Zheng, Yiqiang Chen, Meiyu Huang
https://arxiv.org/abs/1807.07963

上記の論文を読んだので簡単にまとめます．前回読むつもりだった論文です．ICCSE 2018 best paperらしいです．

3行でまとめる

行動認識の転移学習において，色々ソースドメインとなるデータはあるがどれを選択すれば適切かはわからない．
ということで行動認識向け教師なしソースドメイン選択手法(USSAR: Unsupervised Source Selection algorithm for Activity Recognition)を提案する．
また，行動認識に有効な転移NN(TNNAR: Transfer Neural Network to perform knowledge transfer for Activity Recognition)を提案する．

提案手法

教師なしソース選択

本稿は，$D_s$と$D_t$の距離を測る点がチャレンジングである．
ドメイン間の距離を測る手法として，MMDやA distanceという既存手法は汎用的な手法であるため，体の部位の情報等を気にしない．
ということで新たな行動認識向けの距離$D(A,B)=D_g(A,B)+\lambda D_s(A,B)$を定義する．
- gはgeneralでsはspecific，$\lambda$はトレードオフの重み(0~1)．
$D_g$は一般的なA distanceを使用する．$D_g(A,B)=2(1-2\epsilon)$
- $\epsilon$はAとBを予測した際のエラー（今回は線形二値分類器使用とのこと）
$D_s$は行動認識で重要な2つの側面，semantic(意味論)とkinetic(運動)で構成される．
- semanticは空間的な情報をもとにした距離であり，著者らが感覚的に設定した[0~1]の重みらしい（残念）．
- 例えばターゲットが左手のデータ，ソースが右手のデータの場合距離は比較的大きくなる．
- kineticはActivity信号のドメイン間の関係と言いつつ，ただの相関をとっている様子．
- 具体的には今回コサイン類似度が良かったらしい．
最終的に$D(A,B)=D_g(A,B)+\lambda E[\sum_{\boldsymbol{a},\boldsymbol{b}} \frac{w_a\boldsymbol{a}・w_b\boldsymbol{b}}{|w_a\boldsymbol{a}・w_b\boldsymbol{b}|}]$
- $w_a,w_b$に該当するものがsemanticな係数で，片方はターゲットドメインになるので1になる．
上記の距離を用いて，貪欲法で良いソースドメインを逐次探索するらしい．

転移手法

紙面には異なる文字列で書かれているが，私なりに解釈して説明します．
$L(x) = L_c(x) + \mu L_a(D_s, D_t)$ ...(7)
式(7)がネットワークの損失関数で，$L_c(x)$がソースドメイン訓練時の普通の損失関数，$L_a(D_s, D_t)$がソースターゲット間の適応ロスらしい．

ここでモデルが紹介される（Figure3）．見たところ普通のドメイン適応系のモデルで，ソースとターゲットどちらも同じネットワークを通し，FC層の後の出力をMMDにより近づける感じ．
残念ながらこの後で$L_a(D_s, D_t)$が説明されることはなかったがおそらくMMDの結果であろうと推察する．

評価実験

使用データ

OPPOTUNITY，PAMAP2，UCI daily and sportsのデータセットを使用した．
OPPOTUNITYとUCIは5箇所の部位からデータを計測していたため，これらを分割してソースドメイン候補とし，そのうちひとつをランダムに選択してターゲットとした．

ドメイン選択手法の評価

Figure4の通りUSSARで選択したほうが精度が高くなることを他の距離の場合と比べて評価している．

転移手法の評価

比較対象
- PCA: 主成分分析
- KPCA: カーネル主成分分析
- TCA: Transfer Component Analysis¹
- GFK: Geodesic Flow Kernel²
- TKL: Transfer Kernel Learning³
- STL: Stratified Transfer Learning⁴

流石にすべての手法を調べるのは大変なので引用へ．

まとめ

教師なしのドメイン適応手法を行動認識におけるデータセット間転用に使用した（多分初めての）論文．
しっかりと検証しているものの，提案手法の良し悪しには少々疑問が残る．

所管

読了に１時間くらい．前回は行動認識のユーザ適応の論文だったが，今回はデータセット間転移の話．色々と研究はされているものですねぇ．

Sinno Jialin Pan, Ivor W Tsang, James T Kwok, and Qiang Yang. 2011. Domainadaptation via transfer component analysis.IEEE Transactions on Neural Networks22, 2 (2011), 199–210. ↩
Boqing Gong, Yuan Shi, Fei Sha, and Kristen Grauman. 2012. Geodesic flow kernel for unsupervised domain adaptation. In Computer Vision and Patern Recognition (CVPR), 2012 IEEE Conference on. IEEE, 2066–2073. ↩
Mingsheng Long, Jianmin Wang, Jiaguang Sun, and S Yu Philip. 2015. Domain invariant transfer kernel learning.IEEE Transactions on Knowledge and Data Engineering27, 6 (2015), 1519–1532. ↩
Jindong Wang, Yiqiang Chen, Lisha Hu, Xiaohui Peng, and Philip S Yu. 2018.Stratified Transfer Learning for Cross-domain Activity Recognition. In IEEE international conference on pervasive computing and communications (PerCom). ↩

18日目: Deep Transfer Learning for Cross-domain Activity Recognition