0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

[Statistics] 回帰・相関の条件分岐マップ

Posted at

回帰・分散分析一覧

種類 検定統計量 分布 検定方向
単回帰分析(母回帰係数の検定) $\displaystyle t=\frac{\hat{\beta}_1}{s_{\hat{\beta}_1}}$ $t(n-2)$分布 両側($\beta_1=0$ vs $\neq 0$)
重回帰分析(各係数の有意性) $\displaystyle t=\frac{\hat{\beta}_j}{s_{\hat{\beta}_j}}$ $t(n-p-1)$分布 両側($\beta_j=0$ vs $\neq 0$)
重回帰分析(モデル全体の有意性) $\displaystyle F=\frac{(SSR/p)}{(SSE/(n-p-1))}$ $F(p, n-p-1)$分布 右片側
決定係数の検定(寄与の検定) $\displaystyle F=\frac{R^2/p}{(1-R^2)/(n-p-1)}$ $F(p, n-p-1)$分布 右片側
相関係数の検定 $\displaystyle t=\frac{r\sqrt{n-2}}{\sqrt{1-r^2}}$ $t(n-2)$分布 両側($r=0$ vs $\neq 0$)
一元配置分散分析 $\displaystyle F=\frac{S_A/(k-1)}{S_E/(N-k)}$ $F(k-1, N-k)$分布 右片側
二元配置分散分析(要因A/B) $\displaystyle F_A=\frac{S_A/df_A}{S_E/df_E}$, $\displaystyle F_B=\frac{S_B/df_B}{S_E/df_E}$ 各$F(df_A, df_E)$分布 右片側
回帰の分散分析表(回帰・残差分解) $\displaystyle F=\frac{MSR}{MSE}=\frac{SSR/(p)}{SSE/(n-p-1)}$ $F(p, n-p-1)$分布 右片側

迷いやすい帰無仮説

検定の種類 帰無仮説 (H_0) 対立仮説 (H_1)
単回帰分析 母回帰係数は0である(説明変数は目的変数に影響しない) 母回帰係数は0でない(説明変数は目的変数に影響する)
重回帰分析(係数) 各母回帰係数$\beta_j=0$ 少なくとも1つの$\beta_j\neq 0$
重回帰分析(モデル全体) 全ての回帰係数$\beta_1,\beta_2,...,\beta_p=0$ 少なくとも1つ$\beta_j\neq 0$
相関係数の検定 母相関係数$\rho=0$(無相関) $\rho\neq 0$(有相関)
一元配置分散分析 各群の母平均は等しい 少なくとも1群の母平均が異なる
二元配置分散分析(要因A/B) 各要因の水準による母平均の差はない 要因AまたはBに差がある
重回帰モデルの分散分析 回帰による説明分散と残差分散に差はない 回帰による説明分散が有意に大きい

単回帰分析の一般式

$$
Y_i = \beta_0 + \beta_1 X_i + \varepsilon_i
$$

記号 意味
$Y_i$ 目的変数(例:売上)
$X_i$ 説明変数(例:広告費)
$\beta_0$ 切片(回帰直線のY軸との交点)
$\beta_1$ 傾き(説明変数の影響の大きさ)
$\varepsilon_i$ 誤差(観測値と回帰直線との差)
記号 意味
$\hat{\beta}_1$ 標本から推定された回帰係数(傾き)
$s_{\hat{\beta}_1}$ 回帰係数の標準誤差(ばらつきの程度)
自由度 (n - 2)(切片と傾きの2パラメータを推定したため)
分布 t分布 (t(n-2))

重回帰分析の一般式

$$
Y_i = \beta_0 + \beta_1 X_{1i} + \beta_2 X_{2i} + \cdots + \beta_p X_{pi} + \varepsilon_i
$$

記号 意味
$Y_i$ 目的変数
$X_{1i}, X_{2i}, \ldots, X_{pi}$ 複数の説明変数
$\beta_0$ 切片
$\beta_j$ 各説明変数 (X_j) の母回帰係数(影響の強さ)
$\varepsilon_i$ 誤差項(誤差のばらつき)
$p$ 説明変数の個数
$n$ 標本数(データ数)
記号 意味
$\hat{\beta}_j$ 回帰分析で推定された回帰係数(例:広告費、価格など)
$s_{\hat{\beta}_j}$ その回帰係数の標準誤差
自由度 (n - p - 1)(切片1つ+p個の係数を推定したため)
分布 t分布 (t(n - p - 1))

迷いやすい自由度

分析手法 自由度の考え方 自由度の式 備考
単回帰分析(t検定) 回帰直線の当てはまり(2パラメータ:切片・傾き) $n-2$ 切片・傾きを推定したため
重回帰分析(t検定) 回帰係数の個数 $p$ + 切片1個 $n-p-1$ 係数数+切片を推定
重回帰モデル全体のF検定 回帰・残差に分解 $F(p, n-p-1)$ モデル全体の説明力
相関係数の検定 相関計算に2自由度消費 $n-2$ 単回帰と同値
一元配置分散分析 群間:$k-1$,群内:$N-k$ $F(k-1, N-k)$ 群平均の比較
二元配置分散分析 要因A:$a-1$,要因B:$b-1$,誤差:$(a-1)(b-1)$ $F(df_A, df_E)$等 各要因ごとに求める

分析手法別:対応関係まとめ

分析手法 対応する統計検定 分布 目的
単回帰分析 回帰係数のt検定 t分布 傾きの有意性確認
重回帰分析 t検定・F検定 t/F分布 各説明変数およびモデル全体の有意性
相関分析 相関係数のt検定 t分布 相関の有意性確認
一元配置分散分析 F検定 F分布 群平均の差の有無を検定
二元配置分散分析 F検定 F分布 各要因・交互作用の効果検定
0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?