Qiita Engineer Festa20242024年7月17日まで開催中！

仮説検定の帰無仮説について簡単にまとめてみた

Posted at 2024-07-01

1. 帰無仮説とは？

帰無仮説（きむかせつ、Null Hypothesis）とは、統計学において仮説検定を行う際に設定される仮説の一つで、「効果がない」「差がない」「関係がない」といった状態を表します。検定の目的は、この帰無仮説が正しいかどうかをデータを使って検証することです。

具体例

新薬の効果を検証する場合、次のように設定します：

帰無仮説（H₀）：新薬には効果がない（治療グループとコントロールグループの間に有意な差がない）。
代替仮説（H₁）：新薬には効果がある（治療グループとコントロールグループの間に有意な差がある）。

2. 仮説検定の手順

帰無仮説の設定：効果や差がない状態を仮定します。
代替仮説の設定：帰無仮説が正しくない場合の仮説を設定します。
データ収集：実験や観察によってデータを収集します。
検定統計量の計算：データを基に検定統計量を計算します（例：t値、χ²値）。
p値の計算：検定統計量に基づいてp値を計算します。
帰無仮説の棄却または採択：p値が事前に設定した有意水準（通常0.05）以下であれば、帰無仮説を棄却し、代替仮説を支持します。

3. p値とは？

p値（p-value）は、仮説検定において、観測されたデータが帰無仮説の下でどの程度珍しいかを示す確率です。具体的には、観測されたデータまたはそれより極端なデータが帰無仮説が正しい場合に観測される確率を表します。

p値の解釈

p値が低い（通常0.05未満）：観測されたデータは帰無仮説の下では珍しい→帰無仮説を棄却する。
p値が高い（通常0.05以上）：観測されたデータは帰無仮説の下でもよくある→帰無仮説を採択する。

数式での表現

例えば、t検定を使用する場合、p値は次のように計算されます：
$$
p = P(T \geq t_{\text{obs}} | H_0)
$$
ここで、( t_{\text{obs}} )は観測されたt値、( H_0 )は帰無仮説を示します。

4. 具体例：新薬の効果を検証する

ステップ1：帰無仮説と代替仮説の設定

帰無仮説（H₀）：新薬には効果がない。
代替仮説（H₁）：新薬には効果がある。

ステップ2：データ収集

治療グループとコントロールグループに分けて、新薬の効果を測定します。

ステップ3：検定統計量の計算

例えば、t検定を使用して、2つのグループの平均値の差を計算します。
$$
t = \frac{\bar{X_1} - \bar{X_2}}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}
$$
ここで、( \bar{X_1} )と( \bar{X_2} )はそれぞれのグループの平均値、( s_p )はプールされた標準偏差、( n_1 )と( n_2 )は各グループのサンプルサイズです。

ステップ4：p値の計算

観測されたt値に基づいてp値を計算します。仮にp値が0.03であれば、帰無仮説が正しい場合に観測されたデータが起こる確率が3%であることを示します。

ステップ5：帰無仮説の棄却または採択

通常の有意水準（0.05）と比較し、p値がこれより低い（この場合は0.03）ため、帰無仮説を棄却し、新薬には効果があると結論づけます。

5. 効果の大きさについて

帰無仮説の棄却が効果の大きさを意味するわけではありません。効果の大きさ（効果量）を評価するためには、例えば次のような指標を使用します：

平均差
標準化効果量（Cohen's d など）
相関係数

これらの指標を使用して、観測された効果の実質的な大きさを評価します。

まとめ

帰無仮説とp値は統計的検定の基本概念です。帰無仮説は「効果がない」「差がない」という仮定を示し、p値は観測されたデータがこの仮定の下でどの程度珍しいかを示します。仮説検定の手順を理解し、p値を正しく解釈することで、データに基づく結論を導くことができます。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up