0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

[Statistics] 統計モデリング_分散分析

0
Posted at

基本単語

  • 分散分析(ANOVA): 複数群の平均の差を、データのばらつきを分解することで検定する方法
  • 一元配置分散分析: 1つの要因(因子)の影響を検定する分散分析
  • 二元配置分散分析: 2つの要因の影響および交互作用を検定する分散分析
  • 乱塊法(Randomized Block Design): ブロック(ばらつき要因)を固定して精度を上げる設計
  • 完全無作為化法(Completely Randomized Design): 全ての観測をランダムに割り付ける設計
  • 直交表(Orthogonal Array): 要因の効果を効率よく推定するための実験配置表
  • 群間変動: 群平均の違いによるばらつき
  • 群内変動: 誤差によるばらつき
  • 平方和(SS): 偏差の二乗和
  • 平均平方(MS): SSを自由度で割ったもの
  • F統計量: MSの比で定義される検定統計量

分散分析(Analysis of Variance, ANOVA)

「ばらつきを構造的に分解し、要因の影響(平均差)を検定する方法」

概念 入力 出力 意味
分散分析 複数要因・群のデータ F統計量・p値 要因が平均に影響するか

数式表現

一元配置

SST = \sum_{i=1}^{k} \sum_{j=1}^{n_i} (x_{ij} - \bar{x})^2
SSB = \sum_{i=1}^{k} n_i (\bar{x}_i - \bar{x})^2
SSW = \sum_{i=1}^{k} \sum_{j=1}^{n_i} (x_{ij} - \bar{x}_i)^2
F = \frac{SSB/(k-1)}{SSW/(n-k)}

一元配置乱塊法

y_{ij} = \mu + \tau_i + \beta_j + \varepsilon_{ij}
SST = SSA + SSB + SSE
F_{\text{処理}} = \frac{MSA}{MSE}

二元配置完全無作為化法

y_{ij} = \mu + \alpha_i + \beta_j + (\alpha\beta)_{ij} + \varepsilon_{ij}
SST = SSA + SSB + SSAB + SSE
F_A = \frac{MSA}{MSE}, \quad F_B = \frac{MSB}{MSE}, \quad F_{AB} = \frac{MSAB}{MSE}

意味(直感的理解)

・分散分析の本質は「ばらつきの分解」

一元配置

・1つの要因で平均差を見る
・群間 vs 群内

一元配置乱塊法

・ブロック(例:個体差・時間)を明示的に除去
・ノイズを取り除いて精度を上げる

👉 何をしているか
・「説明できるばらつき」と「誤差」を分離

二元配置

・2つの要因の効果を見る
・さらに「交互作用」を確認

👉 交互作用の直感
・Aの効果がBの水準によって変わるか

例:
・薬Aは男性では効くが女性では効かない

👉 これが交互作用

何を固定・何を動かすか

・データは固定
・要因の効果の有無を検定

ポイント

・帰無仮説

H_0: \text{各要因の効果は0}

・分散分析は「平均の差」を検定する

・F統計量が大きい
→ 要因の影響が大きい

・乱塊法のメリット

  • 誤差分散を小さくできる
  • 検出力が上がる

・二元配置の重要点

  • 主効果(A, B)
  • 交互作用(AB)

・交互作用が有意な場合
→ 主効果の解釈は注意

・仮定

  • 正規性
  • 等分散性
  • 独立性

他概念との関係

t検定

  • 2群なら同じ

回帰分析

  • ダミー変数で完全に同一モデル

最尤法

  • 正規分布仮定で一致

実験計画法(DOE)

  • 分散分析はその中心的手法

直交表(Orthogonal Array)

「少ない実験回数で要因効果を独立に推定する設計」

特徴

・各要因が互いに独立(直交)
・効果推定が相互に影響しない

例(L4直交表)

実験 A B
1 1 1
2 1 2
3 2 1
4 2 2

👉 バランスよく配置されている

本質

・「最小の実験で最大の情報」
・工学・品質管理で重要

まとめ

・分散分析は「ばらつきの構造を分解して要因を検定する」

手法 特徴 目的
一元配置 要因1つ 平均差の検定
乱塊法 ブロック考慮 精度向上
二元配置 要因2つ + 交互作用 複雑な影響の解析
直交表 実験効率化 少ない試行で推定

👉 本質
「平均差は、ばらつきの分解として現れる」

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?