以下の統計検定2級®︎対策動画で用いられているスライドの一部です。
統計検定®2級対策オリジナル問題であり、非公式です。
※統計検定®は一般財団法人統計質保証推進協会の登録商標です。
問題
ある農家が、3種類の新しい肥料(A, B, C)がトマトの収穫量(1株あたりの重量、kg)に与える影響を調べるために実験を行った。合計16株のトマトを育て、得られたデータから収穫量の誤差は平均0、分散$\sigma^2$の正規分布に従うと仮定して、一元配置の分散分析を行ったところ、以下の分散分析表が得られた。
分散分析表
| 変動要因 | 自由度 | 平方和 | 平均平方 | F値 | p値 |
|---|---|---|---|---|---|
| 肥料(水準間) | (ア) | 40.0 | (イ) | 10.0 | 0.0023 |
| 残差(水準内) | 13 | 26.0 | (ウ) | ||
| 合計 | 15 | 66.0 |
[1] 分散分析表の(ア)に当てはまる数値を、次の①〜⑤のうちから一つ選べ。
① 1
② 2
③ 3
④ 15
⑤ 16
[2] 分散分析表の(ウ)に当てはまる数値を、次の①〜⑤のうちから一つ選べ。
① 1.0
② 1.7
③ 2.0
④ 13.0
⑤ 26.0
[3] この分散分析の結果に関する記述として、最も適切なものを次の①〜⑤のうちから一つ選べ。
① F値が10.0と大きいため、3種類の肥料による収穫量に差はないと結論できる。
② p値が0.0023と非常に小さいため、有意水準5%において、肥料の種類によって収穫量に統計的に有意な差があると判断できる。
③ 各肥料のサンプル数が異なるため、この分散分析の結果は信頼できない。
④ 肥料Aと肥料Cの平均収穫量が近いため、肥料による収穫量に全体として差はない。
⑤ 残差の自由度が13であることから、実験の精度が低いと判断できる。
解答
- [1] ②
- [2] ③
- [3] ②
問題におけるポイント解説
分散分析 (ANOVA) とは何か?
-
一元配置分散分析 は、統計学の強力なツールです。
-
3つ以上のグループ(水準)の平均値に統計的に有意な差があるか を検定します。
-
使用例:
- 「3種類の薬の効果に差はあるか?」
- 「4つの異なる教育方法で生徒の成績に差は出るか?」
なぜt検定の繰り返しではダメなのか?
一見、t検定を全てのグループの組み合わせで繰り返せば良いように思えます。
(例:AとB、BとC、AとCでそれぞれ検定)
-
しかし、この方法には 「多重比較の問題」 があります。
-
検定を繰り返すたびに、「本当は差がないのに、偶然差があると判断してしまう確率 ( 第一種の過誤 ) 」が積み重なり、全体の結論が誤りやすくなります。
分散分析の仕組み
分散分析は、データの「ばらつき」(分散)を分析することで、 一度の検定 で全てのグループ間の平均値の差を総合的に評価します。
-
データ全体のばらつき(全平方和)を分解する
- グループ間のばらつき (水準間平方和)
- グループ内のばらつき (残差平方和)
グループ間のばらつきが、グループ内の偶然のばらつきよりも十分に大きければ、「グループの平均値には意味のある差がある」と結論できます。この判断指標が F値 です。
統計学における重要性
分散分析は、複数の条件下での実験結果を比較する際に不可欠な手法です。
- 医学
- 農学
- 心理学
- 工学
- マーケティング
など、データに基づいて意思決定を行うあらゆる分野で広く利用されています。
仮説検定の設定
分散分析は仮説検定の一種です。この問題では、以下のように仮説を設定します。
-
帰無仮説 ($H_0$): 3種類の肥料によるトマトの平均収穫量に差はない。
- 各肥料の母平均を $\mu_A, \mu_B, \mu_C$ とすると、
$$H_0: \mu_A = \mu_B = \mu_C$$
- 各肥料の母平均を $\mu_A, \mu_B, \mu_C$ とすると、
-
対立仮説 ($H_1$): 少なくとも1種類の肥料による平均収穫量は他のものと異なる。
- 「$\mu_A, \mu_B, \mu_C$ のうち、少なくとも一つは等しくない」
分析の前提条件
分散分析を行う際には、以下の3つの仮定が置かれます。
-
正規性: 各グループのデータは、それぞれ正規分布に従う。
- 肥料Aの収穫量 $X_A \sim N(\mu_A, \sigma^2)$
- 肥料Bの収穫量 $X_B \sim N(\mu_B, \sigma^2)$
- 肥料Cの収穫量 $X_C \sim N(\mu_C, \sigma^2)$
-
等分散性: 全てのグループの分散 ($\sigma^2$) は等しい。
-
独立性: 観測されたデータは互いに独立である。
【補足】なぜF値はF分布に従うのか?
F値がF分布に従うのは、偶然ではありません。これは F分布の定義そのもの に基づいています。
-
結論: F値は「 互いに独立な2つのカイ二乗分布に従う確率変数を、それぞれの自由度で割ったものの比 」として作られているためです。
-
(イ) 水準間平均平方 と (ウ) 残差平均平方 は、それぞれカイ二乗分布と密接な関係があります。
次のスライドで詳しく見ていきましょう。
【補足】平方和とカイ二乗分布
少し専門的になりますが、平均平方とカイ二乗分布の関係は以下の通りです。
(誤差の分散を $\sigma^2$ とする)
-
残差平均平方 (ウ) との関係
残差平方和 $S_E$ を $\sigma^2$ で割ったものは、自由度 $\nu_E$ のカイ二乗分布に従います。
$$ \frac{S_E}{\sigma^2} \sim \chi^2(\nu_E) $$ -
水準間平均平方 (イ) との関係
帰無仮説が正しいという条件下で 、水準間平方和 $S_A$ を $\sigma^2$ で割ったものも、自由度 $\nu_A$ のカイ二乗分布に従います。
$$ \frac{S_A}{\sigma^2} \sim \chi^2(\nu_A) $$
【補足】F分布の定義とF値
F分布は、以下のように定義される確率分布です。
-
$U_1 \sim \chi^2(\nu_1)$ と $U_2 \sim \chi^2(\nu_2)$ が 互いに独立 であるとき、この2つの比から作られる統計量F
$$ F = \frac{U_1 / \nu_1}{U_2 / \nu_2} $$
は、 自由度 $(\nu_1, \nu_2)$ のF分布 に従います。 -
分散分析のF値は、まさにこの定義に当てはまります。
$$ F値 = \frac{\text{(イ)}}{\text{(ウ)}} = \frac{S_A / \nu_A}{S_E / \nu_E} = \frac{(S_A/\sigma^2) / \nu_A}{(S_E/\sigma^2) / \nu_E} $$
このため、F値は自由度 $(\nu_A, \nu_E)$ すなわち (2, 13) のF分布 に従うのです。
検定統計量とF分布
以上の理論的背景から、検定統計量である F値 は、特定の F分布 に従います。
- F分布は2つの自由度によって形が決まります。
- この問題の場合、F値は 自由度 (2, 13) のF分布 に従います。
- この分布を利用してp値を計算し、仮説の採否を判断します。
問題の再掲
分散分析表
| 変動要因 | 自由度 | 平方和 | 平均平方 | F値 | p値 |
|---|---|---|---|---|---|
| 肥料(水準間) | (ア) | 40.0 | (イ) | 10.0 | 0.0023 |
| 残差(水準内) | 13 | 26.0 | (ウ) | ||
| 合計 | 15 | 66.0 |
解答の根拠 [1] (ア)の値
正解: ② (2)
(ア)は「肥料(水準間)」の自由度です。これは以下の式で計算されます。
水準間の自由度 = (水準の数) - 1
この実験では、肥料A, B, Cの 3種類 の水準があるため、
自由度 = 3 - 1 = 2
したがって、(ア)の値は 2 となります。
解答の根拠 [2] (ウ)の値
正解: ③ (2.0)
(ウ)は「残差(水準内)」の平均平方です。平均平方は、平方和を自由度で割ることで求められます。
平均平方 = 平方和 / 自由度
分散分析表から、残差の平方和は 26.0 、残差の自由度は 13 です。したがって、
(ウ) = 26.0 / 13 = 2.0
よって、(ウ)の値は 2.0 となります。
【参考】(イ)の値とF値の検算
設問にはありませんが、分散分析表の理解を深めるために検算してみましょう。
-
(イ) 水準間の平均平方
(イ) = 水準間平方和 / 水準間自由度
= 40.0 / (ア)
= 40.0 / 2 = 20.0 -
F値
F値 = (イ) / (ウ)
= 20.0 / 2.0 = 10.0
となり、表のF値と一致することが確認できます。
解答の根拠 [3] 結果の解釈
正解: ②
結論を導くために最も重要な指標は p値 です。
- p値 = 0.0023
p値は、帰無仮説(「肥料による収穫量に差はない」)が正しいと仮定したときに、観測されたデータ以上に極端な結果が得られる確率を示します。
一般的に、p値が事前に定めた 有意水準 (通常は 0.05 や 0.01)よりも小さい場合、帰無仮説を棄却します。
今回のp値は 0.0023 であり、これは有意水準 0.05 (5%) よりも十分に小さいです。
($0.0023 < 0.05$)
よって、 「肥料の種類によって収穫量に統計的に有意な差がある」 と結論づけるのが妥当です。
解答の根拠 [3] 他の選択肢の誤り
-
①: F値が大きいほど、群間の差が大きいことを示唆するため、「差はない」という結論は 逆 です。
-
③: 一元配置分散分析は、各グループのサンプル数が異なっていても 適用可能 な手法です。
-
④: 一部のグループの平均値が近いことだけを理由に全体の結論は導けません。分散分析は 全てのグループを総合的に評価 します。
-
⑤: 残差の自由度はサンプルサイズと水準数から決まる値であり、この値自体が実験の 精度を直接示すものではありません 。
