はじめに
Kaggleやっててpandasでpairplot(=散布図行列)をよく見かけるが、
毎回見てて「だから何なの?」の疑問がぬぐい切れず
一念発起して何のための図なのかを調べることにした
今時点の結論
変数間の相関関係を俯瞰できるようにするための図。
一つ一つの解釈は分布図を調べればわかるので譲るとして…
俯瞰出来たら何がよいか、というと。
例えばその相関が説明変数と強いかどうか、という観点で見れば
どの変数を特徴量に使用するのに向いているのか?にも使えるのかなと。
そうすることで特徴選択のヒントになるかな?と思った。
参考URL
とにかく「こんなにオシャレにpairplot描けるよ!」ってサイトばかりで
悲しかったので、参考にしたサイトを残す。
★散布図行列の要素である分布図の主成分分析の考え方についてまとまって理解のきっかけになった
https://logics-of-blue.com/principal-components-analysis/
★散布図行列をシンプルなお手本で紹介してくれたので理解しやすかった
https://www.jmp.com/japan/support/help/Discovering_JMP_21.shtml#123526