基本単語
- 分散分析(ANOVA): 複数群の平均の差を、データのばらつきを分解することで検定する方法
- 一元配置分散分析: 1つの要因(因子)の影響を検定する分散分析
- 二元配置分散分析: 2つの要因の影響および交互作用を検定する分散分析
- 乱塊法(Randomized Block Design): ブロック(ばらつき要因)を固定して精度を上げる設計
- 完全無作為化法(Completely Randomized Design): 全ての観測をランダムに割り付ける設計
- 直交表(Orthogonal Array): 要因の効果を効率よく推定するための実験配置表
- 群間変動: 群平均の違いによるばらつき
- 群内変動: 誤差によるばらつき
- 平方和(SS): 偏差の二乗和
- 平均平方(MS): SSを自由度で割ったもの
- F統計量: MSの比で定義される検定統計量
分散分析(Analysis of Variance, ANOVA)
「ばらつきを構造的に分解し、要因の影響(平均差)を検定する方法」
| 概念 | 入力 | 出力 | 意味 |
|---|---|---|---|
| 分散分析 | 複数要因・群のデータ | F統計量・p値 | 要因が平均に影響するか |
数式表現
一元配置
SST = \sum_{i=1}^{k} \sum_{j=1}^{n_i} (x_{ij} - \bar{x})^2
SSB = \sum_{i=1}^{k} n_i (\bar{x}_i - \bar{x})^2
SSW = \sum_{i=1}^{k} \sum_{j=1}^{n_i} (x_{ij} - \bar{x}_i)^2
F = \frac{SSB/(k-1)}{SSW/(n-k)}
一元配置乱塊法
y_{ij} = \mu + \tau_i + \beta_j + \varepsilon_{ij}
SST = SSA + SSB + SSE
F_{\text{処理}} = \frac{MSA}{MSE}
二元配置完全無作為化法
y_{ij} = \mu + \alpha_i + \beta_j + (\alpha\beta)_{ij} + \varepsilon_{ij}
SST = SSA + SSB + SSAB + SSE
F_A = \frac{MSA}{MSE}, \quad F_B = \frac{MSB}{MSE}, \quad F_{AB} = \frac{MSAB}{MSE}
意味(直感的理解)
・分散分析の本質は「ばらつきの分解」
一元配置
・1つの要因で平均差を見る
・群間 vs 群内
一元配置乱塊法
・ブロック(例:個体差・時間)を明示的に除去
・ノイズを取り除いて精度を上げる
👉 何をしているか
・「説明できるばらつき」と「誤差」を分離
二元配置
・2つの要因の効果を見る
・さらに「交互作用」を確認
👉 交互作用の直感
・Aの効果がBの水準によって変わるか
例:
・薬Aは男性では効くが女性では効かない
👉 これが交互作用
何を固定・何を動かすか
・データは固定
・要因の効果の有無を検定
ポイント
・帰無仮説
H_0: \text{各要因の効果は0}
・分散分析は「平均の差」を検定する
・F統計量が大きい
→ 要因の影響が大きい
・乱塊法のメリット
- 誤差分散を小さくできる
- 検出力が上がる
・二元配置の重要点
- 主効果(A, B)
- 交互作用(AB)
・交互作用が有意な場合
→ 主効果の解釈は注意
・仮定
- 正規性
- 等分散性
- 独立性
他概念との関係
・t検定
- 2群なら同じ
・回帰分析
- ダミー変数で完全に同一モデル
・最尤法
- 正規分布仮定で一致
・実験計画法(DOE)
- 分散分析はその中心的手法
直交表(Orthogonal Array)
「少ない実験回数で要因効果を独立に推定する設計」
特徴
・各要因が互いに独立(直交)
・効果推定が相互に影響しない
例(L4直交表)
| 実験 | A | B |
|---|---|---|
| 1 | 1 | 1 |
| 2 | 1 | 2 |
| 3 | 2 | 1 |
| 4 | 2 | 2 |
👉 バランスよく配置されている
本質
・「最小の実験で最大の情報」
・工学・品質管理で重要
まとめ
・分散分析は「ばらつきの構造を分解して要因を検定する」
| 手法 | 特徴 | 目的 |
|---|---|---|
| 一元配置 | 要因1つ | 平均差の検定 |
| 乱塊法 | ブロック考慮 | 精度向上 |
| 二元配置 | 要因2つ + 交互作用 | 複雑な影響の解析 |
| 直交表 | 実験効率化 | 少ない試行で推定 |
👉 本質
「平均差は、ばらつきの分解として現れる」