予測の確度
各モデルの予測の確度を可視化し、閾値に応じて精度を検証した。
1DCNN
予測の確度の分布は以下のようになる。
各確度ごと
![image.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3487085%2Fbae8b798-b7ab-a9eb-de74-5d0d23931a2a.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=c35d6dcc15969bfaa6287ecb6743f448)
![image.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3487085%2Fb68c225c-07d4-d68a-f59c-634a632f690b.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=0932a53f03f5b1f490a03dd2212ac2db)
累積確度
全ラベル
![image.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3487085%2F42f84986-db3c-979f-a288-78ff3c506400.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=37e979e614594c81225bc22c53e1106d)
各ラベル
![image.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3487085%2F86065949-ecac-3b5d-7574-924ce448d8fc.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=cf4dc089f29e23216bb802fc8a6eb747)
統計量
Statistic |
Minimum |
Maximum |
Mean |
Median |
Std |
Value |
0.25 |
0.72 |
0.42 |
0.42 |
0.05 |
閾値ごとの精度
threshold |
confidence_accuracy |
confidence_ratio |
drop_accuracy |
drop_ratio |
0.00 |
0.955324 |
1.000000 |
0.000000 |
0.000000 |
0.30 |
0.960599 |
0.989074 |
0.477778 |
0.010926 |
0.35 |
0.973807 |
0.913075 |
0.761173 |
0.086925 |
0.40 |
0.982358 |
0.653757 |
0.904278 |
0.346243 |
0.50 |
0.987478 |
0.067865 |
0.952983 |
0.932135 |
Vision Transformer
各確度
![image.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3487085%2F8e4ac419-ab5e-a95c-5428-3abcafdad17c.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=67073c09fd7062159d44fb1ec40bdc9c)
![image.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3487085%2F4f32ef1b-415a-6c5d-73ec-b64a10ce0b43.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=07abe12a51e64164807557154710802e)
累積確度
全ラベル
![image.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3487085%2F2d9d4f88-fd8c-bee2-2c86-cfd625932b0b.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=a1185f2bcd4a126e7a4c0a84f618db5b)
各ラベル
![image.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3487085%2F99f25af8-a8f9-9840-21a3-eafa09359482.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=cdc2acdab9d0d77f260ed3181a27948c)
統計量
Statistic |
Minimum |
Maximum |
Mean |
Median |
Std |
Value |
0.24 |
0.94 |
0.54 |
0.54 |
0.12 |
閾値ごとの精度
threshold |
confidence_accuracy |
confidence_ratio |
drop_accuracy |
drop_ratio |
0.0 |
0.910890 |
1.000000 |
0.000000 |
0.000000 |
0.3 |
0.918989 |
0.984582 |
0.393701 |
0.015418 |
0.4 |
0.956485 |
0.862086 |
0.625880 |
0.137914 |
0.5 |
0.983193 |
0.635668 |
0.784738 |
0.364332 |
0.6 |
0.990076 |
0.318077 |
0.873954 |
0.681923 |
0.7 |
0.990489 |
0.089353 |
0.903080 |
0.910647 |
ConvBackBone Transformer
各確度
![image.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3487085%2F07ff95e2-c938-7a4e-957c-2a8b18dbe227.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=b61d8d1604857bfa5d85807073a2a910)
![image.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3487085%2F54036cb7-732e-2892-dcc3-a84de0a41e1d.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=5a5e7e3bf7a218126d5e793795a21e2f)
累積確度
全ラベル
![image.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3487085%2Fe91d67f9-e9d4-49ed-ceee-01b7050abda8.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=f20ace81f8275b546cf70efbccd51ee7)
各ラベル
![image.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3487085%2F17ec3282-bda5-b4e7-a316-e2acf5b039b1.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=3f95af8feca53a83c99ec0868cac0e56)
統計量
Statistic |
Minimum |
Maximum |
Mean |
Median |
Std |
Value |
0.26 |
0.97 |
0.54 |
0.54 |
0.11 |
閾値ごとの精度
threshold |
confidence_accuracy |
confidence_ratio |
drop_accuracy |
drop_ratio |
0.0 |
0.952046 |
1.000000 |
0.000000 |
0.000000 |
0.3 |
0.953897 |
0.995387 |
0.552632 |
0.004613 |
0.4 |
0.979669 |
0.901663 |
0.698765 |
0.098337 |
0.5 |
0.993693 |
0.635183 |
0.879534 |
0.364817 |
0.6 |
0.997849 |
0.282263 |
0.934032 |
0.717737 |
0.7 |
1.000000 |
0.081826 |
0.947772 |
0.918174 |
比較
各確度
![image.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3487085%2Fe68407d7-f35c-8210-2c03-72f17ba2ed40.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=fa52e4a40e490feeee939be680431f41)
統計量
Statistic |
Minimum |
Maximum |
Mean |
Median |
Std |
1dcnn |
0.25 |
0.72 |
0.42 |
0.42 |
0.05 |
vit |
0.24 |
0.94 |
0.54 |
0.54 |
0.12 |
convbbt |
0.26 |
0.97 |
0.54 |
0.54 |
0.11 |
考察
1DCNNについて、確度と精度に相関は見受けられない。
VisionTransformerについて、確度と精度に一定の相関が見受けられる。
Conv.BackBoneTransformerについて、元の状態(閾値が0)との比較をすると確度と正答率には相関が見受けられる。さらに閾値を0.4にすると明確に精度が向上し、0.5で頭打ちになっている。テストデータのサンプル数が8237なので閾値を0.4にすると800個程度(1%)、0.5にすると3000個程度(36%)確度の低い予測が除かれている。
1DCNNとTransformerアーキテクチャを比較して、そもそもTransformerアーキテクチャでは最終出力にSoftmax関数を用いていない。これはTransformerアーキテクチャでは深い関数となっているのでSoftmax関数を用いて値を確率化してしまうと誤差が小さくなり、逆伝播する値が小さくなってしまうと考えたからである。一方で1DCNNではSoftmax関数を用いている。これは4層の浅いネットワークであるから問題はない、むしろSoftmax関数を用いない場合正答率が70%程度にまで低下してしまうためSoftmax関数を用いなければならない。
その上で精度を比較したところ、確度の大きい予測に対してはTransformerのほうが精度が高い。
誤差の分布について正規分布に従っているように見える。
これについての明確な説明はできないが、仮説として2つ考えている
- 交差エントロピー誤差が予測確率分布を訓練データの確率分布との誤差を計算している
- 中心極限定理により、独立な多数の因子の和として表される確率変数は正規分布に従う
また、1DCNNは非常に急な分布になっていることに関して出力結果を確認すると、他モデルと比べマイナスの値が非常に大きかったことが原因であった。
しかし、Transformerモデルの出力にSoftmax関数を適用することは誤差消失を生んでしまったことから難しく、逆の場合では誤差が発散してしまった為、この問題は根深い。