0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【統計検定®︎2級対策】t検定・分散分析・第一種の過誤・検出力

Posted at

以下の統計検定2級®︎対策動画で用いられているスライドの一部です。

統計検定®2級対策オリジナル問題であり、非公式です。
※統計検定®は一般財団法人統計質保証推進協会の登録商標です。


問題

ある農園で、2種類の新しい農法(農法A、農法B)を用いてトマトを栽培し、それぞれの糖度を測定した。以下の表は、各農法で栽培されたトマト6個ずつの糖度データから算出した平均値と偏差平方和である。

サンプルサイズ 平均糖度 偏差平方和
農法A 6 11.0 12.0
農法B 6 9.0 12.0

各農法で栽培されたトマトの糖度は、独立に正規分布に従い、両農法の母分散は等しいと仮定する。このとき、2つの農法で栽培されたトマトの母平均に差があるかどうかを検定したい。


[1] 2つの母平均の差に関する $t$ 検定を行う。このときの $t$ 値として、最も適切なものを次の①~⑤のうちから一つ選べ。
① 0.50 ② 1.12 ③ 2.24 ④ 3.16 ⑤ 4.00

[2] 同様の仮説について、一元配置分散分析を行う。このときの $F$ 値として、最も適切なものを次の①~⑤のうちから一つ選べ。
① 1.00 ② 2.50 ③ 5.00 ④ 10.0 ⑤ 25.0


解答

[1] ③ 2.24

[2] ③ 5.00


問題のポイント解説

この問題は、統計的仮説検定の代表的な手法である 「$t$検定」「分散分析(ANOVA)」 についての理解を問うています。

  • 目的
    • 2つ(ANOVAは2つ以上)のグループの平均値に 「統計的に意味のある差」 があるのか、それとも 「単なる偶然の差」 なのかを判断するために使われます。

なぜ重要なのか?

$t$検定や分散分析は、科学的な意思決定を行うための強力なツールです。

  • 具体例
    • 医学: 新しい薬の効果を確かめるため、「新薬グループ」と「偽薬グループ」の回復率を比較する。
    • マーケティング: A/Bテストで、2つの広告デザインのクリック率に差があるか評価する。
    • 品質管理: 新旧の製造ラインで、製品の品質に差があるか検証する。

観測された差が 「本物の効果」 なのか 「偶然のばらつき」 なのかを客観的に評価できます。


仮説の設定

検定では、2つの対立する仮説を立てます。

  • 帰無仮説 ($H_0$): 「差はない」という、棄却されることを期待する仮説。

    • 今回の場合: 「農法Aと農法Bで栽培されたトマトの母平均糖度は等しい」($\mu_A = \mu_B$)
  • 対立仮説 ($H_1$): 「差がある」という、証明したい仮説。

    • 今回の場合: 「農法Aと農法Bで栽培されたトマトの母平均糖度は異なる」($\mu_A \neq \mu_B$)

検定とは、データを用いて帰無仮説を棄却できるかどうかを判断するプロセスです。


確率変数とその分布

  • 確率変数

    • この問題では、個々のトマトの 「糖度」 が確率変数です。
    • 連続的な値をとるため、 連続型確率変数 です。
  • 分布

    • 問題の仮定より、各農法のトマトの糖度は 正規分布 に従います。
    • これは、$t$検定や分散分析を適用するための重要な前提条件です。

問題(再掲)

サンプルサイズ 平均糖度 偏差平方和
農法A 6 11.0 12.0
農法B 6 9.0 12.0

[1] 2つの母平均の差に関する $t$ 検定を行う。このときの $t$ 値を求めよ。

① 0.50 ② 1.12  ③ 2.24  ④ 3.16 ⑤ 4.00

[2] 同様の仮説について、一元配置分散分析を行う。このときの $F$ 値を求めよ。

① 1.00 ② 2.50  ③ 5.00  ④ 10.0 ⑤ 25.0


解答の根拠 [1]:$t$検定

$t$検定統計量は、「平均値の差」が「データのばらつき」と比べてどの程度大きいかを示す指標です。

1. プールされた分散 ($s_p^2$) の計算

両群の母分散が等しいと仮定し、データを合わせてより信頼性の高い分散を推定します。

$$
s_p^2 = \frac{SS_A + SS_B}{n_A + n_B - 2}
$$

$$
s_p^2 = \frac{12.0 + 12.0}{6 + 6 - 2} = \frac{24}{10} = 2.4
$$


解答の根拠 [1]:$t$検定

2. $t$値の計算

$t$値は以下の式で計算します。

$$
t = \frac{\bar{x}_A - \bar{x}_B}{\sqrt{s_p^2 \left(\frac{1}{n_A} + \frac{1}{n_B}\right)}}
$$

$$
t = \frac{11.0 - 9.0}{\sqrt{2.4 \left(\frac{1}{6} + \frac{1}{6}\right)}} = \frac{2}{\sqrt{2.4 \times \frac{1}{3}}} = \frac{2}{\sqrt{0.8}}
$$

$$
t \approx \frac{2}{0.8944} \approx 2.236
$$

したがって、最も近い値は ③ 2.24 となります。


解答の根拠 [2]:分散分析

分散分析の$F$値は、「グループ間のばらつき」が「グループ内のばらつき」と比べてどの程度大きいかを示します。

1. 水準内平均平方 (MSE) の計算

グループ内のばらつきを表し、$t$検定で計算したプールされた分散と同じ値になります。

$$
\text{MSE} = \frac{\text{水準内平方和 (SSE)}}{\text{自由度}} = \frac{SS_A + SS_B}{n_A + n_B - 2}
$$

$$
\text{MSE} = \frac{12.0 + 12.0}{10} = 2.4
$$


解答の根拠 [2]:分散分析

2. 水準間平均平方 (MSA) の計算

グループ間のばらつきを表します。まず、全体の平均値 $\bar{\bar{x}}$ を求めます。

$$
\bar{\bar{x}} = \frac{n_A \bar{x}_A + n_B \bar{x}_B}{n_A + n_B} = \frac{6 \times 11.0 + 6 \times 9.0}{12} = 10.0
$$

次に、水準間平方和 (SSA) を計算します。

$$
\text{SSA} = n_A(\bar{x}_A - \bar{\bar{x}})^2 + n_B(\bar{x}_B - \bar{\bar{x}})^2
$$

$$
\text{SSA} = 6(11.0 - 10.0)^2 + 6(9.0 - 10.0)^2 = 6 + 6 = 12.0
$$

最後に、自由度(水準数 - 1)で割って MSA を求めます。

\text{MSA} = \frac{\text{SSA}}{\text{自由度}} = \frac{12.0}{2-1} = 12.0

解答の根拠 [2]:分散分析

3. $F$値の計算

$$
F = \frac{\text{MSA}}{\text{MSE}} = \frac{12.0}{2.4} = 5.0
$$

よって、答えは ③ 5.00 です。

補足:$F=t^2$ の関係について

2群の比較では、$F = t^2$ の関係が成り立ちます。
今回も $2.236^2 \approx 5.0$ となり、計算が正しいことが確認できます。

注意:この関係が成り立つ条件

  1. 比較する群が2つであること。
  2. 独立な2群の比較であること(対応のあるデータではない)。
  3. 等分散を仮定していること(Studentのt検定や分散分析の前提)。
  4. 両側検定のt値を用いていること。

問題

ある工場で、不良品数を削減するため新しい製造ラインを導入した。新ラインで不良品数の分布が変化したかを検定したい。帰無仮説を $H_0:$ 分布は従来通り($P_0$)、対立仮説を $H_1:$ 分布は新しいもの($P_1$)とする。

$H_0$ の下での不良品数 $X$ の分布 ($P_0$)

$x$ 0 1 2 3 4 5以上
$P(X=x)$ 0.05 0.10 0.20 0.30 0.25 0.10

$H_1$ の下での不良品数 $X$ の分布 ($P_1$)

$x$ 0 1 2 3 4 5以上
$P(X=x)$ 0.20 0.35 0.25 0.15 0.05 0.00

[1] 棄却域を $X \le 1$ とする検定(検定A)について、最も適切な記述を選べ。

① この検定の第一種の過誤の確率は 0.05 で、検出力は 0.20 である。
② この検定の第一種の過誤の確率は 0.15 で、検出力は 0.45 である。
③ この検定の第一種の過誤の確率は 0.55 で、検出力は 0.15 である。
④ この検定の第二種の過誤の確率は 0.15 で、検出力は 0.55 である。
⑤ この検定の第一種の過誤の確率は 0.15 で、検出力は 0.55 である。

[2] 棄却域を $X \le 2$ とする検定(検定B)と検定Aを比較した記述として、最も適切なものを選べ。

① 検定Aの有意水準は検定Bより高いが、検出力は検定Bより低い。
② 検定Aの有意水準は検定Bより低いが、検出力は検定Bより高い。
③ 検定Aの有意水準は検定Bより低いが、検出力も検定Bより低い。
④ 検定Aの有意水準と検出力は、ともに検定Bより高い。
⑤ 検定Aの有意水準と検出力は、ともに検定Bと等しい。


解答

[1] ⑤ この検定の第一種の過誤の確率は 0.15 で、検出力は 0.55 である。

[2] ③ 検定Aの有意水準は検定Bより低いが、検出力も検定Bより低い。

image.png


問題のポイント解説

この問題は、仮説検定の核心的な概念である 「第一種の過誤」「第二種の過誤」「検出力」 の理解を問うています。

  • 検定は完璧な判断ではなく、必ず誤りを犯す可能性があります。
  • これらの概念を理解することは、検定ケッカを正しく解釈し、その限界を認識するために不可欠です。

検定における2種類の誤り (1)

裁判に例えると分かりやすいです。
帰無仮説 =「被告人は無実である」

  • 第一種の過誤 (Type I Error, $\alpha$)
    • 無実の人を有罪にしてしまう誤り。
    • 統計学では: 帰無仮説(差はない)が正しいのに、誤って棄却し「差がある」と結論づけてしまうこと。
    • この確率 $\alpha$ を 有意水準 と呼びます。通常は低く(例: 5%)設定されます。

検定における2種類の誤り (2)

帰無仮説 =「被告人は無実である」

  • 第二種の過誤 (Type II Error, $\beta$)
    • 真犯人を無罪放免にしてしまう誤り。
    • 統計学では: 対立仮説(差がある)が正しいのに、帰無仮説を棄却できず「差があるとは言えない」と結論づけてしまうこと。

検出力 (Power, $1-\beta$)

  • 定義

    • 真犯人を正しく有罪にできる確率。
    • 統計学では: 対立仮説が正しいときに、正しく帰無仮説を棄却し 「差がある」 と結論づけることができる確率です。
  • なぜ重要か?

    • 検出力は検定の 「性能」 そのものです。
    • 検出力が低いと、本当に効果があってもそれを見逃してしまいます。
    • 研究を計画する際、十分な検出力を確保できるサンプルサイズ設計が重要になります。

仮説・確率変数・分布

  • 仮説の設定

    • $H_0$: 製造ラインは従来のままで、不良品数の分布は $P_0$ に従う。
    • $H_1$: 製造ラインが新しくなり、不良品数の分布は $P_1$ に従う。
  • 確率変数とその分布

    • 確率変数: 1時間あたりの不良品数 $X$。0, 1, 2, ... という飛び飛びの値をとる 離散型確率変数 です。
    • 分布: 問題文に与えられた2つの確率分布 $P_0$ と $P_1$ を考えます。

問題(再掲)

$H_0$ の下での分布 ($P_0$)

$x$ 0 1 2 3 4 5以上
$P(X=x)$ 0.05 0.10 0.20 0.30 0.25 0.10

$H_1$ の下での分布 ($P_1$)

$x$ 0 1 2 3 4 5以上
$P(X=x)$ 0.20 0.35 0.25 0.15 0.05 0.00

[1] 棄却域を $X \le 1$ とする検定Aの性能は?
[2] 棄却域を $X \le 2$ とする検定Bと検定Aの比較は?

image.png


解答の根拠 [1]:検定Aの性能評価

棄却域: $X \le 1$
(不良品数が0個か1個だったら「新ラインは効果あり」と判断するルール)

1. 第一種の過誤の確率 ($\alpha$)

$H_0$が正しい(分布は$P_0$)のに、間違って棄却域 ($X \le 1$) に入ってしまう確率。

$$
\alpha = P(X \le 1 | H_0) = P(X=0|P_0) + P(X=1|P_0)
$$
$$
\alpha = 0.05 + 0.10 = 0.15
$$

image.png


解答の根拠 [1]:検定Aの性能評価

2. 検出力 ($1-\beta$)

$H_1$が正しい(分布は$P_1$)ときに、正しく棄却域 ($X \le 1$) に入る確率。

$$
\text{検出力} = P(X \le 1 | H_1) = P(X=0|P_1) + P(X=1|P_1)
$$
$$
\text{検出力} = 0.20 + 0.35 = 0.55
$$

以上より、第一種の過誤の確率は0.15、検出力は0.55となり、⑤が正解です。

image.png


解答の根拠 [2]:検定Aと検定Bの比較

まず、それぞれの検定の性能を計算します。

  • 検定A (棄却域: $X \le 1$)

    • 有意水準 $\alpha_A = 0.15$
    • 検出力 $1-\beta_A = 0.55$
  • 検定B (棄却域: $X \le 2$)

    • 有意水準 ($\alpha_B$): $H_0$の下で棄却域に入る確率
      $$
      \alpha_B = P(X \le 2 | H_0) = 0.05 + 0.10 + 0.20 = 0.35
      $$

解答の根拠 [2]:検定Aと検定Bの比較

  • 検定B (棄却域: $X \le 2$)
    • 検出力 ($1-\beta_B$): $H_1$の下で棄却域に入る確率
      $$
      1-\beta_B = P(X \le 2 | H_1) = 0.20 + 0.35 + 0.25 = 0.80
      $$

両者の比較

  • 有意水準: $\alpha_A (=0.15) < \alpha_B (=0.35)$
  • 検出力: $1-\beta_A (=0.55) < 1-\beta_B (=0.80)$

「検定Aの有意水準は検定Bより低いが、検出力も検定Bより低い」となり、③が正解です。


これは、棄却基準を緩める(棄却域を広げる)と、誤って棄却する確率($\alpha$)は上がりますが、本当に差があるときにそれを見つけ出す力(検出力)も上がる、という トレードオフの関係 を示しています。

image.png

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?