重回帰分析とは、多変量解析のうち複数の説明変数と一つの目的変数が量的なデータの場合に用いることができる解析手法です。
#前回のおさらいと今回すること
R言語の無相関検定によって説明変数として適している座高、体重、足の大きさから身長を予測する重回帰式を導出しました。
今回は導出した重回帰式が信頼できるか重回帰式の検定を行います。
#重回帰式の検定
重回帰分析から得られた結果と重回帰式は以下のとおりです。
重回帰式の当てはまりが良い→推定した重回帰式に意味があることを示します(下図参照)。
重回帰式の検定では分散分析表を用いたF分布表による分散比𝐹0の検定をします。F分布表はネットで検索すると出てくると思います。
分散分析表は上記にある重回帰分析の結果にあります。赤丸が分散比𝐹0です。
下図は分散分析表の概要です。nはサンプル数で今回は15です。pは変数の数で今回は3です。
結果として、座高、体重、足の大きさから身長を予測する重回帰式は信頼できることがわかりました。
#まとめと次回の予定
・重回帰分析の結果から導出した重回帰式を検定しました。
・重回帰式の検定では分散分析表を用いました。
・結果として、座高、体重、足の大きさから身長を予測する重回帰式は信頼できることがわかりました。
・次回は各説明変数の偏回帰係数の検定を行います。
#おまけ(決定係数)
得られた回帰モデルのあてはまり具合を示す指標として決定係数があります。
決定係数R^2は0から1までの値をとり、説明変数と目的変数の間に完全な線的な関係があれば𝑅^2=1となります。
決定係数を平方和の比で表すと
今回の決定係数は重回帰分析の結果から、0.969478であることがわかり、導出した重回帰式は当てはまりが良いことがわかります(下図参照)。
#あとがき
今後も今回くらいの量で書いていきたいと思います。
ここまでお読みいただきありがとうございます。