背景
前回「一元配置分散分析」をしたので、二元配置分散分析をするかと思ったのですが、パーリンノイズと単回帰分析で迷った末、キリの良い所で単回帰分析からすることにしました。統計的推定、統計的検定、一元配置分散分析、単回帰分析で統計検定2級のお勉強は一旦終わりになりそうです。具体例を見ていくことはすると思います。
今回は「とけたろう(2020.5)、単回帰分析【中学の数学からはじめる統計検定2級講座第17回】、Youtube」を使わせて頂いています。
前回の記事
統計的推定と検定をPythonで解く「統計的仮説検定(一元配置分散分析)」(2020.5.2)
目的:回帰式の使い方を知る
まずは、回帰式の使い方を知ることからです。それに付随して回帰分析で使われる用語を把握していきたいと思います。
問題
解答
どういう問題か(問題の分類)
統計検定2級で問われている単回帰分析の内容は難しい物ではない様です。単回帰分析で出てくる統計量を求められるように出来れば良さそうです。2級の範囲ではありませんが重回帰分析もありますので、これをベースに回帰分析の理解を深めたいです。
どのように解けるか(概要)
単回帰分析で出てくる回帰式や統計量を求める式に当てはめる。
どのように解けるか(Python)
どのように解けるか(解法)
今回も、提示されている情報を元に一つずつ答えを求めていきます。データがあったり作れたりすれば、Pythonのstatsmodels
で回帰分析出来るみたいですが、私の今の能力ではそれは出来ないので割愛します。そうしてしまうと、Pythonというより本当に手計算になってしまうので、今回はPythonは無しにしたいと思います。
まずは、(1)でt値を求めるには「回帰係数/標準誤差」の様です。つまり、
となります。
次に(2)は回帰式に当てはめていきます。$y=a+bx$の$a,b$にはそれぞれ切片とxの回帰係数が入ります。計算すると下の様になります。
最後に(3)の問題です。これは、「残差平方和を残差平方和の自由度で割ると、誤差項の分散の不偏推定値になる」事を使います。詳細は以下に記載します。
参考
感想
今回は単回帰分析を行いましたが、単に統計検定2級を簡単になぞるだけになってしまいました。一応、統計検定2級の範囲を網羅した気になっていますが、その時々で準1級まで調べる事が多々ありました。特に一元配置分散分析や単回帰分析ではチラッと入るだけで、面白い所は準1級でやるような印象を持ちました。私にとってはそれが余計な混乱になり、記事の作成が遅くなったり、中途半端になったりしている気がします。次は趣向を変えてパーリンノイズをやってみたいと思っています。
#次の記事
次回は、パーリンノイズの予定です。