PCAとオートエンコーダについて
解決したいこと
データサイエンス初学者です。
特徴量抽出で主成分分析やオートエンコーダを利用しているコード例を見ました。
皆様はこれら手法をどのように用いていますか?
(有効な特徴量が見つからない時にまずはエイヤーでぶち込む、
もしくは特徴量の一つとしてなど)
また、主成分分析とオートエンコーダ、どちらを利用すべきかについても
ご教授頂けますと嬉しいです。
よろしくお願いします。
0
データサイエンス初学者です。
特徴量抽出で主成分分析やオートエンコーダを利用しているコード例を見ました。
皆様はこれら手法をどのように用いていますか?
(有効な特徴量が見つからない時にまずはエイヤーでぶち込む、
もしくは特徴量の一つとしてなど)
また、主成分分析とオートエンコーダ、どちらを利用すべきかについても
ご教授頂けますと嬉しいです。
よろしくお願いします。
ざっと申し上げると
主成分分析
主成分として解釈しやすい
複雑な構造のデータでは解釈が難しい
オートエンコーダー
複雑な構造のデータでもうまく圧縮できる
圧縮した解釈として主成分のような理解できる値がない
でしょうか
テーブルデータ(数値やカテゴリ値などExcel的なデータ)ならばまずは主成分分析だと思います
画像データなどであればまずはオートエンコーダーになるのかなと思います