記事の内容
仮説検定は、そもそも、その論理を理解するのが厄介です。
その厄介さを乗り越え、仮説検定の意味、概念、使い方はなんとなくわかってきたとしましょう。
このとき、「サイズ」と「検出力」という用語が出てきます。
この用語のイメージがいつまでたっても私にはわからなかったのです。
少し調べてみると、私だけでなく、その用語と意味が結びつかず覚えにくい、という声があるようです。多くの初学者が同じ点でつまずきます。
よって、この記事では、
「なぜその名前なのか?」
という語源・イメージに焦点を当てた説明をまとめます。
丸暗記ではなく、イメージで理解・記憶できるようになることを目指します。
解答の見通し (本記事の戦略)
この問題の根幹は、「用語の"名前"」と「統計的な"意味"」の間に、直感的なつながりがない(ように見える)ことです。
そこで本記事では、単に定義を羅列するのではなく、「火災報知器のテスト」という一つのたとえ話を軸に据えます。
- まず、仮説検定を「火災報知器が正しく作動するか」という意思決定の問題として捉え直します。
- 次に、「サイズ」と「検出力」が、この火災報知器の「性能」を測る指標であることを示します。
- 最後に、なぜ「サイズ (Size)」「検出力 (Power)」という名前が付けられたのか、その語源的なイメージに迫ります。
STEP 1: 状況設定 — 仮説検定は「火災報知器」だ
仮説検定を理解するために、高性能な「火災報知器」を新しく開発したと想像してください。この報知器が正しく作動するかをテストします。
ここには、「2つの真実」と「2つの決定」があります。
2つの真実 (我々にはコントロールできない)
- $H_0$ (帰無仮説): 「火事は起きていない」 (平常時)
- $H_A$ (対立仮説): 「火事が起きている」 (異常時)
2つの決定 (報知器が下す判断)
- $H_0$ を棄却 (Reject $H_0$): 「火事だ!」と警報を鳴らす。
- $H_0$ を棄却しない (Fail to Reject $H_0$): 「平常時」と判断し、沈黙する。
この組み合わせによって、4つのパターンが生まれます。
| 真実: $H_0$ (火事なし) | 真実: $H_A$ (火事あり) | |
|---|---|---|
| 決定: 棄却 (警報ON) |
誤報 (False Alarm) (第一種の過誤) |
成功 (Correct Detection) |
| 決定: 棄却せず (警報OFF) | 成功 (Correct Silence) |
見逃し (Miss) (第二種の過誤) |
「サイズ」と「検出力」は、この表の中の「誤報」と「成功(Correct Detection)」の確率を指しています。
STEP 2: 「サイズ (Size)」とは何か? — 誤報を許容する「枠」の大きさ
まず、「サイズ」から解説します。
定義
(1)
$\alpha = P(\text{決定: 警報ON} \mid \text{真実: 火事なし})$
(2)
$\alpha = P(H_0 \text{ を棄却} \mid H_0 \text{ が真})$
これは「第一種の過誤 (Type I Error)」を犯す確率であり、一般に $\alpha$ (アルファ) という記号で表されます。統計家は、この $\alpha$ のことを「検定のサイズ (Size of the test)」と呼びます。
なぜ「サイズ」と呼ぶのか?
ここが最重要ポイントです。
統計家が検定を行うとき、最初に「どのくらい珍しいことが起きたら、警報を鳴らす($H_0$ を棄却する)か」という基準を決めます。
例えば、「火事ではない($H_0$ が真)のに、偶然、煙の測定値が100を超える確率は 5% しかない」とわかっているとします。
このとき、「もし測定値が100を超えたら、警報を鳴らそう」と決めます。
この「100を超える」という範囲を「棄却域 (Rejection Region)」と呼びます。
$H_0$ が真である(火事ではない)場合、検定統計量(= 煙の測定値)がこの棄却域に入る確率は 5% です。
(3)
$\alpha = P(\text{測定値が棄却域に入る} \mid H_0 \text{ が真}) = 5%$
統計家はこの $\alpha$ の値(この例では 5%)を、棄却域という「領域」が全体($H_0$ の分布)に対して占める「大きさ (Size)」または「面積 (Area)」として捉えました。
結論 (サイズ):
「サイズ」とは、「棄却域の"大きさ"」のことです。これは、「$H_0$ が正しい(火事ではない)ときに、間違って警報を鳴らしてしまう(棄却してしまう)確率 $\alpha$」と等しくなります。検定を行う前に、研究者が「このくらいの"サイズ"の誤報リスク(例: 5%)までは許容しよう」と決める値であるため、**「有意水準 (Significance Level)」**とも呼ばれます。
STEP 3: 「検出力 (Power)」とは何か? — 本当の異常を見抜く「力」
次に、「検出力」です。
定義
(4)
$\text{検出力} = P(\text{決定: 警報ON} \mid \text{真実: 火事あり})$
(5)
$\text{検出力} = P(H_0 \text{ を棄却} \mid H_A \text{ が真})$
これは、「火事が本当に起きているときに、報知器が正しく警報を鳴らせる確率」を意味します。
なぜ「検出力」と呼ぶのか?
こちらは「サイズ」よりも直感的です。
「検出力」は、英語の "Power" を直訳したものです。
- "Power" = 力、能力、性能
つまり、この検定(火災報知器)が、本物の火事($H_A$)をどれだけ強力に「検出 (Detect)」できるか、その「力 (Power)」をそのまま表しているのです。
- 検出力が高い (High Power): 高性能な報知器。小さなボヤでも見逃さずに警報を鳴らせる。
- 検出力が低い (Low Power): 性能の悪い報知器。大火事にならないと警報が鳴らず、役に立たない。
結論 (検出力):
「検出力」とは、文字通り、「対立仮説($H_A$)が正しい(火事が起きている)ときに、それを正しく見抜く"力"」\のことです。
私たちが検出力(パワー)を確保してまでキャッチしたいのは、「統計的に有意」であるだけでなく、「実務的・科学的に意味のある (Meaningful)」差を持つ対立仮説です。
STEP 4: (補足) 検出力と「第二種の過誤」の関係
検出力を理解する上で、セットで語られるのが「第二種の過誤 ($\beta$)」です。
定義 ($\beta$)
(6)
$\beta = P(\text{決定: 警報OFF} \mid \text{真実: 火事あり})$
(7)
$\beta = P(H_0 \text{ を棄却しない} \mid H_A \text{ が真})$
これは「火事が起きているのに、報知器が沈黙してしまう(見逃す)」確率です。
検出力との関係
「真実が火事($H_A$)である」とき、報知器の決定は「警報ON(検出成功)」か「警報OFF(見逃し)」の二択しかありません。
したがって、
(8)
$P(\text{警報ON} \mid \text{火事あり}) + P(\text{警報OFF} \mid \text{火事あり}) = 1$
(9)
$(\text{検出力}) + (\beta) = 1$
(10)
$\text{検出力} = 1 - \beta$
検出力とは、「火事を見逃す確率 ($\beta$)」の逆(余事象)なのです。
まとめ: イメージで覚える「サイズ」と「検出力」
これで、2つの用語をイメージで記憶できるはずです。
-
サイズ (Size = $\alpha$)
- 意味: 誤報の確率 (火事じゃないのに警報が鳴る)。
- 名前の由来: $H_0$(火事なし)の分布のうち、警報が鳴るエリア(棄却域)の「大きさ(サイズ)」。
-
検出力 (Power = $1 - \beta$)
- 意味: 正しく検知する確率 (火事のときに警報が鳴る)。
- 名前の由来: $H_A$(火事あり)という事実を、どれだけ強力に**「検出できるかという"力"」**。