概要
機械学習において、次元の呪いによってどういった問題が起こるのかの備忘録である。
具体的な問題点を以下に挙げてみた。
- 多くの次元を学習する必要があり、データ量が必要になる。
- データ量と次元の多さからトレーニング時間が増える。
- 不要なノイズが多く、ニューラルネットワークではそういったノイズにまで適合し、過学習が起こる。
- 余計な特徴量があることでサンプル間の類似度を適切に評価できなくなる。
参考文献
https://atmarkit.itmedia.co.jp/ait/articles/2006/29/news023.html
https://datachemeng.com/post-4856/