More than 5 years have passed since last update.

論文まとめ：Human activity recognition based on time series analysis using U-Net

Last updated at 2019-10-29Posted at 2019-10-28

はじめに

Netで見つけた以下の論文
[1] Y. Sun, et. al "Human activity recognition based on time series analysis using U-Net"
のざっくりしたまとめ。

acceptされたjournal等は不明。

機械学習を用いて時系列データを解析し、人の行動認識を行うモデルの従来手法（deep learning 以前）は論文をざっくりまとめるとこんな感じか？

１）まず時系列データから一部のsequentialを切り取る。

２）それに前処理を施す。

３）次に特徴量を抽出する。これは生データから抽出する場合とFFTなどで周波数領域に飛ばし、そこから抽出する場合がある。

４）最後に特徴量を用いて行動の分類をする。SVMや決定木などを用いる。全ての特徴量を用いる場合と、次元圧縮してから用いる場合がある。

これらはハンドメイドな特徴量抽出器なので、最終的な分類精度が頭打ち。

これに対し、deep learningを用いると以下の図のような感じか？

１）やはり時系列データから一部のsequentialを切り取る。

２）それに前処理を施す

３）1-d conv や RNN を用いて特徴量抽出＆分類を一気に行う。論文にはないが３、４年前に流行った2-d convも入れてみた。

特徴量抽出器も学習することで精度の向上が期待できる。

しかし著者が言うところの「multi-class window problem」は残る。

これは、sliding windowで切り取ったsequentialに対して常に１つの行動が付与されるという問題。行動の切り替わり部分では２つ以上の行動が対応するはず。

提案手法は以下。

U-Net構造を用いることで、各時刻に対する行動を付与できる。これで「multi-class window problem」を克服できる。

７つのdatasetで他の手法とaccuracy, F1-scoreで比較した結果は以下。

表示している数値は各datasetにおけるaccuracy, F1値を平均したもの。

U-Netが一番高い。