はじめに
第35回人工知能学会全国大会で発表された以下の論文
[1] Naoki Nonaka, Jun Seita, RandECG: Data Augmentation for Deep Neural Network based ECG . The 35th Annual Conference of the Japanese Society for Artificial Intelligence, 2021.
https://www.jstage.jst.go.jp/article/pjsai/JSAI2021/0/JSAI2021_2N1IS2a02/_pdf/-char/ja
のまとめ
概要
- ECG dataに対するaugmentationの研究
- 種々の data augmentation を加えた結果、心房細動の分類タスクでaccuracyが3.51%改善した
背景
- Deep Learningを使う場合、データセットが足りてなければdata augmentationが重要だが、ECG data に対するdata augmentationはこれまで研究されてなかった
- vsion系はもちろん、speech recognition 系の augmentation もそのままでは使えないので、今回種々のaugmentation手法を実験して効果を検証した
実験の設定
dataset
-
PhysioNet / Computing in Cardiology Challenge 2017 dataset
https://physionet.org/content/challenge-2017/1.0.0/
(下の方にdatasetのリンクがある) -
The China Physiological Signal Challenge 2018 dataset
http://2018.icbeb.org/Challenge.html
(入手方法は未調査)
ネットワークのアーキテクチャ
以下のような1dの単純なResNet構造。
メトリクス
- macro F1
試した data augmentation 手法
以下の図は今回試したdata augmentation 手法とそのハイパーパラメータの値(の最大値?)。
ここで出てくる range of magnitude 値・・・例えばscaleの[0.25,4]・・・は下記での結果図のmagnitude=20に相当するということか?(このあたり詳しく書かれてないが、参照としている[2]の論文では「magnitude=10 ・・・ 角度30度に対応」などとなっていることを考えると、range of magnitudeがM=10か20だろう)
実験結果
PhysioNet17を用いて、各手法単独の精度を検証
以下の図で各列はaugmentationの手法、各行はmagnitude(magnitude=20が上記range of magnitudeか?)
本文中にも書いているが、統計的に有意なくらいに精度が改善しているのは、shiftのみとのこと。他のaugmentation単体では精度改善が微小か、あるいは悪化している。
PhysioNet17を用いて、各手法の組み合わせで精度を検証
以下の図で、各列は採用したaugmentation手法の数、各行はmagnitude。どのような組み合わせなのか、あるいはランダムに組み合わせたものを何度も試行しているのか、等不明
小さい範囲で多数のaugmentationを用いるとそれないの成果があるようだ。
まとめと感想
結果を概観してのまとめ
この論文読んだだけでは不明点が多いが、以下のような点は言えるか。
- augmentation単独ではshiftが最も効く
- augmentationを組み合わせれば、適切な強度において精度が上がる
- 組み合わせの数や、用いるaugmentationの中身、あるいはその強度によっては精度が悪化する
感想
- shiftに効果があるのは、training dataとtest dataのピーク取得法が異なる等が関係しているのだろうか?
- 本論文では行なっていないが、単独で精度の良いもので組み合わせを作れば、より精度のよいものが得られる気がする
- 精度の改善が良くても3%程度なのは、元々データが豊富にあるためか?つまりデータが少なければより大きな改善が期待できるだろうか
reference
[2] Cubuk, E.D., Zoph, B., Shlens, J., Le, Q.V.: Ran- daugment: Practical automated data augmentation with a reduced search space. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pat- tern Recognition Workshops. pp. 702–703 (2020)