重回帰分析とは、多変量解析のうち複数の説明変数と一つの目的変数が量的なデータの場合に用いることができる解析手法です。
前回のおさらいと今回すること
前回は座高、体重、足の大きさから身長を予測する重回帰式の偏回帰係数の検定を行いました。
結果としては、座高の偏回帰係数のみ信頼できることがわかりました。
そのため今回は、座高のみを用いて再度重回帰分析を行います(説明変数が1つになったので単回帰分析です)。
導出や検定に関してはリンクを参照していただけると方法が詳しくわかると思います。
再度重回帰式の導出
座高のみを用いて再度重回帰分析を行った結果と重回帰式は以下のとおりです。
赤丸で囲んだところが重回帰式の偏回帰係数と定数項a0です。
青丸は決定係数と下記の検定で用いる数値です。


再度重回帰式の検定
帰無仮説と対立仮説を設定します。

重回帰式の検定では分散分析表を用いたF分布表による分散比𝐹0の検定をします。F分布表はネットで検索すると出てくると思います。
分散分析表は上記にある重回帰分析の結果にあります。赤丸が分散比𝐹0です。

下図は分散分析表の概要です。nはサンプル数で今回は15です。pは変数の数で今回は1です。




結果として、座高から身長を予測する重回帰式(単回帰式)は信頼できることがわかりました。
また、上図の分散分析表の赤丸の隣にある有意Fの数値を見ると、有意水準0.005より小さいため重回帰式が信頼できることがわかります。
分散分析表の分散比と有意Fの数値のどちらを用いても結果は同じになります。
再度偏回帰係数の検定
帰無仮説と対立仮説を設定します。

偏回帰係数の検定では重回帰分析結果からt値とt値を2乗したF値から,それぞれt分布表とF分布表を用いて検定を行います。

上記の結果から下記のことがわかりました。

結果として、座高の偏回帰係数は信頼できることがわかりました。
また、上図の赤丸の隣にあるP-値の数値を見ると、有意水準0.005より小さいため座高の偏回帰係数が信頼できることがわかります。
t値とp-値の数値のどちらを用いても結果は同じになります。
再度定数項a0の検定
帰無仮説と対立仮説を設定します。

定数項a0の検定では重回帰分析結果からt値とt値を2乗したF値から,それぞれt分布表とF分布表を用いて検定を行います。
重回帰分析の結果をまとめると、

上記の結果から下記のことがわかりました。

結果として、定数項は信頼できることがわかりました。
また、上図の赤丸の隣にあるP-値の数値を見ると、有意水準0.005より小さいため定数項が信頼できることがわかります。
t値とp-値の数値のどちらを用いても結果は同じになります。
まとめ
・前回の結果から再度重回帰分析を行いました。
・結果としては、座高のみを説明変数とする単回帰分析になりました。
・重回帰式(単回帰式)、偏回帰係数、定数項の検定ではすべて有意水準0.5%で信頼できることがわかりました。
・最終的に座高から身長を予測する単回帰式が導出できました。
おまけ(決定係数)
得られた回帰モデルのあてはまり具合を示す指標として決定係数があります。
決定係数R^2は0から1までの値をとり、説明変数と目的変数の間に完全な線的な関係があれば𝑅^2=1となります。
今回の決定係数は重回帰分析の結果から、0.96607であることがわかり、導出した重回帰式は当てはまりが良いことがわかります(下図参照)。

あとがき
再度重回帰分析をしましたが、行っていることは過去の記事通りです。
今回の記事では結果を主に書きましたが、導出や方法につきましてはリンクから過去の記事を参照していただけるとありがたいです。
上記にも何度もありますが、説明変数が1つになったので単回帰分析でもあります。
少々ややこしいと思いますが、ご了承ください。
単回帰分析になってしまったので、重回帰分析で行う予定だった多重共線性や標準偏回帰係数については見送らせていただきます。
注意ですが、今回用いたデータは適当に作成したものです。
R言語とExcelを用いた重回帰分析の方法1~6をお読みいただきありがとうございます。