はじめに
今回は1-4で説明した推測統計の中でも特に重要な枠組みである仮説検定について説明をします。
目次
- 仮説検定とは
- 具体例
- 第一種の過誤と第二種の過誤
1. 仮説検定とは
事前に立てた仮説に対して、その仮説が正しいかどうかを検証する作業のこと。
仮説検定でよく用いられる、新薬の効果を検証する例を踏まえながら説明していきたいと思います。
新薬の効果の検証とは、新薬を投与したグループと偽薬を投与したグループを比較することで新薬の有効性を検証する実験です。
新薬を投与したグループを処理群といい、偽薬を投与した比較対照のための群を対照群といいます。
この2つの群を比較し「新薬に効果がある」という仮説について検定を行っていきます。(今回は血圧を下げる新薬を仮定する)
処理群の患者の血圧値の母集団Aと対照群の血圧値の母集団Bについて考えると、「新薬に効果がある」という仮説は母集団Aにおける平均値$\mu_A$が母集団Bの平均値$\mu_B$とは異なること、つまり$\mu_A \neq \mu_B$と表せる。
逆に新薬に効果がないのであれば、$\mu_A = \mu_B$となることがわかると思います。
※立てる仮説は母集団に対する仮説であって、標本に関してではありません。
ここで「新薬に効果がある」「新薬に効果がない」という2つの仮説が出てきたが、仮説検定ではこの2つの仮説を立てることでどちらの仮説を許容するかをデータから検証していきます。
仮説検定では、示したい仮説の否定命題を帰無仮説、示したい仮説を対立仮説といいます。
今回の例では次のようになります。
帰無仮説:「新薬に効果がない $\mu_A = \mu_B$」
対立仮説:「新薬に効果がある $\mu_A \neq \mu_B$」
仮説検定の流れとしては、この2つの検定を立てデータなどから帰無仮説が誤っていることを主張することで対立仮説を支持します。
基本的には仮説検定の結果には次の2つしか存在しないことも覚えておきましょう
- 帰無仮説を棄却することで対立仮説を支持する
- 帰無仮説を棄却できないので、帰無仮説・対立仮説どちらか一方のみを支持することはできない。判断保留。
ではこの検証の進め方について説明していきます。
まずは一旦帰無仮説が正しいと仮定して検証を進めていきます。つまり2つの母集団の母平均が等しいと仮定して、母集団AとBからそれぞれ標本抽出を行います。標本には標本誤差がありますから、たとえ母集団平均が等しい世界であったとしても標本平均は標本を得るたびに何かしらの差が生まれるでしょう。ここで実際の処理群と対照群から得られた標本平均の差は、帰無仮説が正しい世界ではどの程度起きるものなのかを考えます。もしもデータが仮想世界では非常にまれだとするならば、仮想世界が間違っている、つまり帰無仮説が正しいという仮定が間違っているということで帰無仮説を棄却できそうです。
帰無仮説が正しい仮想世界で現実で得られたデータがどの程度起きやすいかを評価するためにp値を計算します。
p値の定義は、「帰無仮説が正しいと仮定した時に観察された値以上に極端な値が出る確率」で表します。
ここで帰無仮説を棄却するかどうかの判断の境目に用いる値を**有意水準$\alpha$**といいます。
最後に簡単に仮説検定の流れについてグラフ化したものを配置しておきます。長々と説明してしまいましたが、次章で例題を用いて検定について説明していくのでそちらでさらに理解を深めてもらえればと思います。
2. 具体例
今回行う検定は先ほどまで扱っていた新薬と偽薬に関して実施します。処理群と対照群の2つの群間の平均値を比較する検定を2群間の比較のt検定といいます。
例題に入る前にまず「2群間の比較のt検定」について説明したいと思います。
1-4の記事で標本誤差の分布について説明したと思います。
簡単に振り返ると、中心極限定理を用いることで標本誤差=$\bar x - \mu$は平均$0$、標準偏差$\sigma/\sqrt n$に従うといったものです。
また標準偏差の$\sigma$は未知の値なので代わりに不偏標準偏差$s$を用いる必要もありました。
これを今回の2群間の比較のt検定でも用いると、
$(\bar x_A - \bar x_B)-(\mu_A - \mu_B)$は、平均$0$、標準偏差$s \sqrt{\frac{1}{n_A} + \frac{1}{n_B}} \ $の正規分布にざっくりと従うことがわかります。
ここで帰無仮説と対立仮説を立てると次のようになります。
帰無仮説:「新薬に効果がない $\mu_A = \mu_B$」
対立仮説:「新薬に効果がある $\mu_A \neq \mu_B$」
1章でも説明したように、仮説検定を行うにはまず帰無仮説が正しい世界を想定する必要があるので、帰無仮説を正しいとすると仮定すると
$(\bar x_A - \bar x_B)$は、平均$0$、標準偏差$s \sqrt{\frac{1}{n_A} + \frac{1}{n_B}} \ $の正規分布にざっくりと従うことがわかります。これで帰無仮説が正しい世界での2群間の標本平均の差の近似的な分布が得られました。
これを標準化したものをt検定で使用するt値として、現実のデータがこの分布の中のどこに位置するかを考えていきます。t値は次のように表せます。
t = \frac{\bar x_A - \bar x_B}{s\sqrt{\frac{1}{n_A} + \frac{1}{n_B}}}
ちなみに不偏標準偏差sは次のようになりますが、Rとかを使えば計算は勝手に行われるのであまり気にしなくてよいです。
s = \sqrt{\frac{(n_a-1)s^2_A + (n_B-1)s^2_B}{n_a + n_B - 2}} \
例題に入る前にもう1つだけ重要な内容、棄却域について説明しておきます。
有意水準5%の際の棄却域は、分布の右端・左端の2.5%ずつの領域のことを指します。(両側検定の場合)
つまり下のグラフでいうところの色付き箇所が棄却域となり、棄却域に現実の値が含まれているとき、$p < 0.05$となり、流石に帰無仮説の下では現実のデータは起きにくいだろうと考えて帰無仮説を棄却する流れとなっております。
逆を言えば「acceptance region」内に現実の値があれば、帰無仮説を棄却できないということです。
では実際に例題を用いて2群間の比較のt検定を実施しましょう。
今回2つの例を使いますが、どちらも実験内容は同じになります。
【前提条件】
実験内容:血圧を下げる新薬の検証を行います。被験者14人を7人ずつの2グループに分けて、一方には新薬を投与、もう一方には偽薬を投与し血圧を測定しました。次のような血圧が得られたとき、新薬に効果はあるといえるでしょうか?
帰無仮説:「新薬に効果がない $\mu_A = \mu_B$」
対立仮説:「新薬に効果がある $\mu_A \neq \mu_B$」
【検定】
例1
まずはRを用いないで、数学的な観点から検定を実施します。
新薬(母集団A) | 偽薬(母集団B) |
---|---|
142 | 145 |
132 | 130 |
127 | 150 |
140 | 142 |
142 | 145 |
130 | 155 |
126 | 148 |
$\bar x_A = 134.1$、$\bar x_B = 145.0$、$n_A = n_B= 7$となり、これを用いてt値を計算すると$t=-2.73$となる。
この現実の値であるt値は、以下グラフを見てわかるように棄却域に含まれている。2.5%点の値は、統計数値表を見るとわかるが今回は自由度12のt分布表をみると、2.5%点の値は大体2.17となる。よってt値が棄却域に含まれていたので、帰無仮説を棄却し対立仮説を受容する。
よって「2群間の平均値には差がある」といえると結論付けられる。
ただ実際にデータ分析を行う際はRなどで簡単に実行できるので、そちらの説明も実施したいと思う。
Rで実際に検定を行った結果が以下になる。
こちらを見てわかるように、各標本平均やt値の値が先ほど計算で求めたものと一致するのがわかる。
特に着目してほしいのはp値である。今回p値は、0.018をとっている。これは有意水準5%で考えるのであれば、$p<\alpha$となるため帰無仮説を棄却して対立仮説を受容すると判断することができる。
例2
新薬(母集団A) | 偽薬(母集団B) |
---|---|
148 | 145 |
138 | 130 |
133 | 150 |
146 | 142 |
148 | 145 |
136 | 155 |
132 | 148 |
上記測定結果をRを用いて検定を実施する。有意水準は5%とする。
以下結果を見るとp値は0.2456をとっており、$p > \alpha$となる。よって帰無仮説を棄却することはできず、統計的に有意な差は見られなかったと結論付けられる。(帰無仮説と対立仮説どちらを支持することもできない)
3. 第一種の過誤と第二種の過誤
第一種の過誤
帰無仮説が正しいにもかかわらず、帰無仮説を棄却してしまう誤りのことです。先ほどの新薬の例でいえば、本当は何ら効果がない新薬にもかかわらず、効果がると判断してしまう誤りを指します。その誤りが起こる確率を有意水準$\alpha$で表します。
詳しい説明は省きますが、有意水準をコントロールすることでこの誤りがどれくらいの確率で起こるかがわかります。
よく使用されるのは有意水準5%ですが、この場合帰無仮説が正しいときに平均して20回に1回ほど帰無仮説を誤って棄却し対立仮説を採択してしまうことになります。
第二種の過誤
対立仮説が正しいにもかかわらず、帰無仮説を棄却しない誤りのことです。先ほどの新薬の例でいえば、本当は差があるにもかかわらず、差があるとは言えないと帰無仮説を棄却しない判断を下してしまう誤りを指します。その誤りが起こる確率を$\beta$で表します。またこの第二種の過誤を起こさない確率を検出力といい、$1-\beta$で表します。
$\beta$は$\alpha$と違ってコントロールをすることができず、サンプルサイズが大きくなるにつれて$\beta$は小さくなる性質があります。通常$1 -\beta \ $を80%に設定することが好ましいとされているため、80%になるようにサンプルサイズを設計することが理想的な仮説検定の手順といえるでしょう。こちらについては、また別の記事で紹介いたします。
最後に$\alpha$と$\beta$間には、一方を大きくするともう一方が小さくなるという関係があります。
そのため無暗に$\alpha$や$\beta$を小さくしすぎないようにしましょう。こういう過誤が起こるリスクがあることを許容して、検定を行うようにしましょう。