1. 帰無仮説とは?
帰無仮説(きむかせつ、Null Hypothesis)とは、統計学において仮説検定を行う際に設定される仮説の一つで、「効果がない」「差がない」「関係がない」といった状態を表します。検定の目的は、この帰無仮説が正しいかどうかをデータを使って検証することです。
具体例
新薬の効果を検証する場合、次のように設定します:
- 帰無仮説(H₀):新薬には効果がない(治療グループとコントロールグループの間に有意な差がない)。
- 代替仮説(H₁):新薬には効果がある(治療グループとコントロールグループの間に有意な差がある)。
2. 仮説検定の手順
- 帰無仮説の設定:効果や差がない状態を仮定します。
- 代替仮説の設定:帰無仮説が正しくない場合の仮説を設定します。
- データ収集:実験や観察によってデータを収集します。
- 検定統計量の計算:データを基に検定統計量を計算します(例:t値、χ²値)。
- p値の計算:検定統計量に基づいてp値を計算します。
- 帰無仮説の棄却または採択:p値が事前に設定した有意水準(通常0.05)以下であれば、帰無仮説を棄却し、代替仮説を支持します。
3. p値とは?
p値(p-value)は、仮説検定において、観測されたデータが帰無仮説の下でどの程度珍しいかを示す確率です。具体的には、観測されたデータまたはそれより極端なデータが帰無仮説が正しい場合に観測される確率を表します。
p値の解釈
- p値が低い(通常0.05未満):観測されたデータは帰無仮説の下では珍しい→帰無仮説を棄却する。
- p値が高い(通常0.05以上):観測されたデータは帰無仮説の下でもよくある→帰無仮説を採択する。
数式での表現
例えば、t検定を使用する場合、p値は次のように計算されます:
$$
p = P(T \geq t_{\text{obs}} | H_0)
$$
ここで、( t_{\text{obs}} )は観測されたt値、( H_0 )は帰無仮説を示します。
4. 具体例:新薬の効果を検証する
ステップ1:帰無仮説と代替仮説の設定
- 帰無仮説(H₀):新薬には効果がない。
- 代替仮説(H₁):新薬には効果がある。
ステップ2:データ収集
治療グループとコントロールグループに分けて、新薬の効果を測定します。
ステップ3:検定統計量の計算
例えば、t検定を使用して、2つのグループの平均値の差を計算します。
$$
t = \frac{\bar{X_1} - \bar{X_2}}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}
$$
ここで、( \bar{X_1} )と( \bar{X_2} )はそれぞれのグループの平均値、( s_p )はプールされた標準偏差、( n_1 )と( n_2 )は各グループのサンプルサイズです。
ステップ4:p値の計算
観測されたt値に基づいてp値を計算します。仮にp値が0.03であれば、帰無仮説が正しい場合に観測されたデータが起こる確率が3%であることを示します。
ステップ5:帰無仮説の棄却または採択
通常の有意水準(0.05)と比較し、p値がこれより低い(この場合は0.03)ため、帰無仮説を棄却し、新薬には効果があると結論づけます。
5. 効果の大きさについて
帰無仮説の棄却が効果の大きさを意味するわけではありません。効果の大きさ(効果量)を評価するためには、例えば次のような指標を使用します:
- 平均差
- 標準化効果量(Cohen's d など)
- 相関係数
これらの指標を使用して、観測された効果の実質的な大きさを評価します。
まとめ
帰無仮説とp値は統計的検定の基本概念です。帰無仮説は「効果がない」「差がない」という仮定を示し、p値は観測されたデータがこの仮定の下でどの程度珍しいかを示します。仮説検定の手順を理解し、p値を正しく解釈することで、データに基づく結論を導くことができます。