0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【仮説検定あるある】「サイズ」と「検出力」という用語が意味と全然つながらない

Posted at

記事の内容

仮説検定は、そもそも、その論理を理解するのが厄介です。

その厄介さを乗り越え、仮説検定の意味、概念、使い方はなんとなくわかってきたとしましょう。

このとき、「サイズ」と「検出力」という用語が出てきます。
この用語のイメージがいつまでたっても私にはわからなかったのです。

少し調べてみると、私だけでなく、その用語と意味が結びつかず覚えにくい、という声があるようです。多くの初学者が同じ点でつまずきます。

よって、この記事では、

「なぜその名前なのか?」

という語源・イメージに焦点を当てた説明をまとめます。
丸暗記ではなく、イメージで理解・記憶できるようになることを目指します。


解答の見通し (本記事の戦略)

この問題の根幹は、「用語の"名前"」と「統計的な"意味"」の間に、直感的なつながりがない(ように見える)ことです。

そこで本記事では、単に定義を羅列するのではなく、「火災報知器のテスト」という一つのたとえ話を軸に据えます。

  1. まず、仮説検定を「火災報知器が正しく作動するか」という意思決定の問題として捉え直します。
  2. 次に、「サイズ」と「検出力」が、この火災報知器の「性能」を測る指標であることを示します。
  3. 最後に、なぜ「サイズ (Size)」「検出力 (Power)」という名前が付けられたのか、その語源的なイメージに迫ります。

STEP 1: 状況設定 — 仮説検定は「火災報知器」だ

仮説検定を理解するために、高性能な「火災報知器」を新しく開発したと想像してください。この報知器が正しく作動するかをテストします。

ここには、「2つの真実」と「2つの決定」があります。

2つの真実 (我々にはコントロールできない)

  1. $H_0$ (帰無仮説): 「火事は起きていない」 (平常時)
  2. $H_A$ (対立仮説): 「火事が起きている」 (異常時)

2つの決定 (報知器が下す判断)

  1. $H_0$ を棄却 (Reject $H_0$): 「火事だ!」と警報を鳴らす。
  2. $H_0$ を棄却しない (Fail to Reject $H_0$): 「平常時」と判断し、沈黙する。

この組み合わせによって、4つのパターンが生まれます。

真実: $H_0$ (火事なし) 真実: $H_A$ (火事あり)
決定: 棄却 (警報ON) 誤報 (False Alarm)
(第一種の過誤)
成功 (Correct Detection)
決定: 棄却せず (警報OFF) 成功 (Correct Silence) 見逃し (Miss)
(第二種の過誤)

「サイズ」と「検出力」は、この表の中の「誤報」と「成功(Correct Detection)」の確率を指しています。


STEP 2: 「サイズ (Size)」とは何か? — 誤報を許容する「枠」の大きさ

まず、「サイズ」から解説します。

定義

(1)
$\alpha = P(\text{決定: 警報ON} \mid \text{真実: 火事なし})$

(2)
$\alpha = P(H_0 \text{ を棄却} \mid H_0 \text{ が真})$

これは「第一種の過誤 (Type I Error)」を犯す確率であり、一般に $\alpha$ (アルファ) という記号で表されます。統計家は、この $\alpha$ のことを「検定のサイズ (Size of the test)」と呼びます。

なぜ「サイズ」と呼ぶのか?

ここが最重要ポイントです。

統計家が検定を行うとき、最初に「どのくらい珍しいことが起きたら、警報を鳴らす($H_0$ を棄却する)か」という基準を決めます。

例えば、「火事ではない($H_0$ が真)のに、偶然、煙の測定値が100を超える確率は 5% しかない」とわかっているとします。
このとき、「もし測定値が100を超えたら、警報を鳴らそう」と決めます。

この「100を超える」という範囲を「棄却域 (Rejection Region)」と呼びます。

$H_0$ が真である(火事ではない)場合、検定統計量(= 煙の測定値)がこの棄却域に入る確率は 5% です。

(3)
$\alpha = P(\text{測定値が棄却域に入る} \mid H_0 \text{ が真}) = 5%$

統計家はこの $\alpha$ の値(この例では 5%)を、棄却域という「領域」が全体($H_0$ の分布)に対して占める「大きさ (Size)」または「面積 (Area)」として捉えました。

結論 (サイズ):
「サイズ」とは、「棄却域の"大きさ"」のことです。

これは、「$H_0$ が正しい(火事ではない)ときに、間違って警報を鳴らしてしまう(棄却してしまう)確率 $\alpha$」と等しくなります。検定を行う前に、研究者が「このくらいの"サイズ"の誤報リスク(例: 5%)までは許容しよう」と決める値であるため、**「有意水準 (Significance Level)」**とも呼ばれます。


STEP 3: 「検出力 (Power)」とは何か? — 本当の異常を見抜く「力」

次に、「検出力」です。

定義

(4)
$\text{検出力} = P(\text{決定: 警報ON} \mid \text{真実: 火事あり})$

(5)
$\text{検出力} = P(H_0 \text{ を棄却} \mid H_A \text{ が真})$

これは、「火事が本当に起きているときに、報知器が正しく警報を鳴らせる確率」を意味します。

なぜ「検出力」と呼ぶのか?

こちらは「サイズ」よりも直感的です。
「検出力」は、英語の "Power" を直訳したものです。

  • "Power" = 力、能力、性能

つまり、この検定(火災報知器)が、本物の火事($H_A$)をどれだけ強力に「検出 (Detect)」できるか、その「力 (Power)」をそのまま表しているのです。

  • 検出力が高い (High Power): 高性能な報知器。小さなボヤでも見逃さずに警報を鳴らせる。
  • 検出力が低い (Low Power): 性能の悪い報知器。大火事にならないと警報が鳴らず、役に立たない。

結論 (検出力):
「検出力」とは、文字通り、「対立仮説($H_A$)が正しい(火事が起きている)ときに、それを正しく見抜く"力"」\のことです。

私たちが検出力(パワー)を確保してまでキャッチしたいのは、「統計的に有意」であるだけでなく、「実務的・科学的に意味のある (Meaningful)」差を持つ対立仮説です。


STEP 4: (補足) 検出力と「第二種の過誤」の関係

検出力を理解する上で、セットで語られるのが「第二種の過誤 ($\beta$)」です。

定義 ($\beta$)

(6)
$\beta = P(\text{決定: 警報OFF} \mid \text{真実: 火事あり})$

(7)
$\beta = P(H_0 \text{ を棄却しない} \mid H_A \text{ が真})$

これは「火事が起きているのに、報知器が沈黙してしまう(見逃す)」確率です。

検出力との関係

「真実が火事($H_A$)である」とき、報知器の決定は「警報ON(検出成功)」か「警報OFF(見逃し)」の二択しかありません。

したがって、

(8)
$P(\text{警報ON} \mid \text{火事あり}) + P(\text{警報OFF} \mid \text{火事あり}) = 1$

(9)
$(\text{検出力}) + (\beta) = 1$

(10)
$\text{検出力} = 1 - \beta$

検出力とは、「火事を見逃す確率 ($\beta$)」の(余事象)なのです。


まとめ: イメージで覚える「サイズ」と「検出力」

これで、2つの用語をイメージで記憶できるはずです。

  • サイズ (Size = $\alpha$)

    • 意味: 誤報の確率 (火事じゃないのに警報が鳴る)。
    • 名前の由来: $H_0$(火事なし)の分布のうち、警報が鳴るエリア(棄却域)の「大きさ(サイズ)」。
  • 検出力 (Power = $1 - \beta$)

    • 意味: 正しく検知する確率 (火事のときに警報が鳴る)。
    • 名前の由来: $H_A$(火事あり)という事実を、どれだけ強力に**「検出できるかという"力"」**。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?