不偏分散
標本分散の期待値が母分散に一致するように標本分散の算出式に$\frac{n}{(n-1)}$をかけたものが不偏分散の算出式となります。
s^2 = \frac{1}{n-1}\sum_{i=1}^{n} (x_i - \bar{x})^2
例えば、ある中学校の2年性の200人からランダムに選んだ10人の数学のテストの結果から不偏分散を求める場合は以下のようになります。
データ:70 85 45 90 60 100 90 75 85 70
\bar{x}=\frac{70+85+45+90+60+100+90+75+85+70}{10} = 77
s^2 = \frac{1}{10-1}\sum_{i=1}^{10} (x_i - \bar{x})^2\\
=\frac{1}{9}\times\left\{(70-77)^2+(85-77)^2+(45-77)^2+(90-77)^2+(60-77)^2\\+(100-77)^2+(90-77)^2+(75-77)^2+(85-77)^2+(70-77)^2\right\}\\
=\frac{1}{9}\times(7^2+8^2+32^2+13^2+17^2+23^2+13^2+2^2+8^2+7^2)\\
=\frac{1}{9}\times(49+64+1024+169+289+529+169+4+64+49)\\
=267.78
標準偏差(母平均)
標準偏差は母集団から得られた個々のデータのばらつきを表すものであり、分散の正の平方根で定義されます。
s = \sqrt{\frac{1}{n-1}\sum_{i = 1}^{n} (x_i - \bar{x})^2}
先ほど求めた不偏分散から標準偏差を計算すると以下のようになります。
s^2 = 267.78\\
s = \sqrt{267.78}=16.36
標準誤差(母平均)
標準誤差(SE:standard error)は推定量の標準偏差であり、標本から得られる推定量そのもののバラつき(=精度)を表すものです。
SE = \sqrt{\frac{s^2}{n}} = \frac{s}{\sqrt{n}}
例えば、ある中学校の男子生徒の身長を2年生400人の中からランダムに10人選んだ場合の標準誤差は以下のようになります。
データ:160 155 167 162 170 174 166 154 161 169
\bar{x}=\frac{160+155+167+162+170+174+166+154+161+169}{10} = 163.8
s^2 = \frac{1}{10-1}\sum_{i=1}^{10} (x_i - \bar{x})^2\\
=\frac{1}{9}\times\left\{(160-163.8)^2+(155-163.8)^2+(167-163.8)^2+(162-163.8)^2+(170-163.8)^2\\+(174-163.8)^2+(166-163.8)^2+(154-163.8)^2+(161-163.8)^2+(169-163.8)^2\right\}\\
=\frac{1}{9}\times(3.8^2+8.8^2+3.2^2+1.8^2+6.2^2+10.2^2+2.2^2+9.8^2+2.8^2+5.2^2)\\
=\frac{1}{9}\times(14.44+77.44+10.24+3.24+38.44+104.04+4.84+96.04+7.84+27.04)\\
=42.62
よって標準誤差は以下のようになります。
SE = \sqrt{\frac{s^2}{n}} = \sqrt{\frac{42.62}{10}} = 2.064
母平均の95%信頼区間(母分散既知)
95%信頼区間とは、無作為抽出を100回繰り返し、そのつど信頼区間を計算した場合、95回くらいは信頼区間中に母数が含まれるということを示します。標準正規分布表において上側2.5%点は「1.96」であり、負の数である「-1.96」以下の値をとる確率も2.5%となり、以下のように表せます。
\bar{x}-1.96\times\sqrt{\frac{\sigma^2}{n}}\leq\mu\leq\bar{x}+1.96\times\sqrt{\frac{\sigma^2}{n}}
例えば、日本人男性100人をランダムに選んで身長を計測した場合、平均身長が172cm、母分散が$\sigma^2=5.5^2$で、正規分布に従う場合の95%信頼区間は以下のようになります。
172-1.96\times\sqrt{\frac{5.5^2}{100}}\leq\mu\leq172+1.96\times\sqrt{\frac{5.5^2}{100}}\\
172-1.078\leq\mu\leq 172+1.078\\
170.9\leq\mu\leq 173.1
母平均の90%信頼区間(母分散既知)
標準正規分布において上側5%点は「1.64」であることから、次のようになります。
\bar{x}-1.64\times\sqrt{\frac{\sigma^2}{n}}\leq\mu\leq\bar{x}+1.64\times\sqrt{\frac{\sigma^2}{n}}
例えば、日本人男性100人をランダムに選んで身長を計測した場合、平均身長が172cm、母分散が$\sigma^2=5.5^2$で、正規分布に従う場合の90%信頼区間は以下のようになります。
172-1.64\times\sqrt{\frac{5.5^2}{100}}\leq\mu\leq172+1.64\times\sqrt{\frac{5.5^2}{100}}\\
172-0.9\leq\mu\leq 172+0.9\\
171.1\leq\mu\leq 172.9
母平均の99%信頼区間(母分散既知)
標準正規分布において上側0.5%点は「2.58」であることから、次のようになります。
\bar{x}-2.58\times\sqrt{\frac{\sigma^2}{n}}\leq\mu\leq\bar{x}+2.58\times\sqrt{\frac{\sigma^2}{n}}
例えば、日本人男性100人をランダムに選んで身長を計測した場合、平均身長が172cm、母分散が$\sigma^2=5.5^2$で、正規分布に従う場合の99%信頼区間は以下のようになります。
172-2.58\times\sqrt{\frac{5.5^2}{100}}\leq\mu\leq172+2.58\times\sqrt{\frac{5.5^2}{100}}\\
172-1.419\leq\mu\leq 172+1.419\\
170.6\leq\mu\leq 173.4
母平均の信頼区間(母分散未知)
母分散が分からない場合、母集団の平均$\mu$を、標本平均を$\bar{x}$、不偏分散を$s^2$、抽出したサンプルサイズを$n$、信頼係数を$(1-\alpha)$とすると、次の式から母平均$\mu$の信頼区間を求めることができます。
\bar{x}-t_{\alpha/2}(n-1)\times\sqrt{\frac{s^2}{n}}\leq\mu\leq\bar{x}+t_{\alpha/2}(n-1)\times\sqrt{\frac{s^2}{n}}
例えば、50人のクラスからランダムに5人選んだときの英語のテストの結果が次の場合、クラス全体の平均点の95%信頼区間は以下の通りになります。
データ:75 85 50 60 95
\bar{x}=\frac{75+85+50+60+95}{5} = 73
s^2 = \frac{1}{5-1}\sum_{i=1}^{5} (x_i - \bar{x})^2\\
=\frac{1}{4}\times\left\{(75-73)^2+(85-73)^2+(50-73)^2+(60-73)^2+(95-73)^2\right\}\\
=\frac{1}{4}\times(2^2+12^2+23^2+13^2+22^2)\\
=\frac{1}{4}\times(4+144+529+169+484)\\
=332.5
t分布表より、
t_{\alpha/2}(n-1)=t_{0.025}(4)=2.776
よって、
73-2.776\times\sqrt{\frac{332.5}{5}}\leq\mu\leq73+2.776\times\sqrt{\frac{332.5}{5}}\\
50.36\leq\mu\leq95.64
プールされた分散
対応がないデータの場合のそれぞれのデータから算出される分散をまとめたプールされた分散は、次の式のように表します。
s^2_p = \frac{(n_1-1)s^2_1+(n_2-1)s^2_2}{n_1+n_2-2}
例えば、A高校の1年生から6人、B高校の1年生から8人をそれぞれランダムに選んだときの国語のテスト結果が以下の通りだった場合、プールされた分散は以下のようになります。
A高校の平均点:70点、不偏分散:250
B高校の平均点:60点、不偏分散:200
s^2_p = \frac{(6-1)250+(8-1)200}{6+8-2} = \frac{1250+1400}{12} = 220.83
母平均の差の信頼区間(母分散未知)
母平均の差の信頼区間は以下のように求められます。
(\bar{x_1}-\bar{x_2})-t_{\alpha/2}(n_1+n_2-2)\times\sqrt{s^2_p\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}\leq\mu_1-\mu_2\leq(\bar{x_1}-\bar{x_2})+\\t_{\alpha/2}(n_1+n_2-2)\times\sqrt{s^2_p\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}
例えば先ほどの条件の時、A高校とB高校の国語のテストの平均点の差の95%信頼区間は、以下のようになります。
(70-60)-t_{0.025}(6+8-2)\times\sqrt{220.83\left(\frac{1}{6}+\frac{1}{8}\right)}\leq\mu_1-\mu_2\leq(70-60)+\\t_{0.025}(6+8-2)\times\sqrt{220.83\left(\frac{1}{6}+\frac{1}{8}\right)}
10-2.179\times\sqrt{220.83\left(\frac{7}{24}\right)}\leq\mu_1-\mu_2\leq10+2.179\times\sqrt{220.83\left(\frac{7}{24}\right)}
-7.49\leq\mu_1-\mu_2\leq27.49
母比率の95%信頼区間
母平均の推定のように、母比率についても区間推定を以下のように行うことができます。
\hat{p}-1.96\times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\leq\mu\leq\hat{p}+1.96\times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}
例えば、サイコロを500回投げた時、6の目が100回出た場合、6の目が出る母比率の95%信頼区間は以下のようになります。
この場合、サンプルサイズは、$n=500$、割合$p$の推定値$\hat{p}$は、$\hat{p}=\frac{100}{500}=0.2$となるので、以下のようになります。
0.2-1.96\times\sqrt{\frac{0.2(1-0.2)}{500}}\leq\mu\leq0.2+1.96\times\sqrt{\frac{0.2(1-0.2)}{500}}\\
0.2-0.035\leq\mu\leq0.2+0.035\\
0.165\leq\mu\leq0.235
サンプルサイズの算出
母比率$p$がわかっており、求める信頼区間が決まっている場合は、以下の式のようにサンプルサイズを求めることができます。
2\times z_{\frac{1-\alpha}{2}}\times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}
例えば、ある番組の視聴率が20%以下であり、95%信頼区間を5%以下にするために必要なサンプル数は以下のように計算できます。
2\times z_{0.025}\times\sqrt{\frac{0.2(1-0.2)}{n}}\leq0.05
\sqrt{n}\geq2\times 1.96\times\sqrt{0.2(1-0.2)}\times\frac{1}{0.05}
\sqrt{n}\geq31.36
n\geq983.45
よって、984人以上のサンプルサイズが必要になります。
母比率の差の95%信頼区間
母比率の差の信頼区間は以下のように求めることができます。
(\hat{p_1}-\hat{p_2})-1.96\times\sqrt{\frac{\hat{p_1}(1-\hat{p_1})}{n_1}+\frac{\hat{p_2}(1-\hat{p_2})}{n_2}}\leq\mu\leq(\hat{p_1}-\hat{p_2})+\\1.96\times\sqrt{\frac{\hat{p_1}(1-\hat{p_1})}{n_1}+\frac{\hat{p_2}(1-\hat{p_2})}{n_2}}
例えば、ある商品のアンケートについて、男性については300人中150人(割合0.5)、女性については250人中100人(割合0.4)が買ってみたいと答えた場合、この商品を買ってみたいと答えた割合の差の95%信頼区間は以下のようになります。
(0.5-0.4)-1.96\times\sqrt{\frac{0.5(1-0.5)}{300}+\frac{0.4(1-0.4)}{250}}\leq\mu\leq(0.5-0.4)+\\1.96\times\sqrt{\frac{0.5(1-0.5)}{300}+\frac{0.4(1-0.4)}{250}}
0.1-1.96\times\sqrt{\frac{0.25}{300}+\frac{0.24}{250}}\leq\mu\leq0.1+1.96\times\sqrt{\frac{0.25}{300}+\frac{0.24}{250}}
0.1-0.083\leq\mu\leq0.1+0.083
0.017\leq\mu\leq0.183
母分散の信頼区間
母分散の区間推定はカイ二乗分布を用いて以下のように行うことができます。
\frac{(n-1)s^2}{\chi^2_{\alpha/2}(n-1)}\leq\sigma^2\leq\frac{(n-1)s^2}{\chi^2_{1-\alpha/2}(n-1)}
例えば、ランダムに選んだ男性5人の体重を測定して、次のようなデータが得られた時、男性の体重の母分散の95%信頼区間は以下のようになります。
No | 体重(kg) |
---|---|
1 | 70.4 |
2 | 82.3 |
3 | 76.3 |
4 | 60.7 |
5 | 67.9 |
\bar{x}=\frac{70.4+82.3+76.3+60.7+67.9}{5}=71.52
s^2 = \frac{1}{5-1}\sum_{i=1}^{5} (x_i - \bar{x})^2\\
=\frac{1}{4}\times\left\{(70.4-71.52)^2+(82.3-71.52)^2+(76.3-71.52)^2+\\(60.7-71.52)^2+(67.9-71.52)^2\right\}\\
=\frac{1}{4}\times(1.25+116.20+22.85+117.07+13.10)\\
=67.62
よって
\frac{4\times67.62}{\chi^2_{0.025}(4)}\leq\sigma^2\leq\frac{4\times67.62}{\chi^2_{0.975}(4)}\\
\frac{4\times67.62}{11.14}\leq\sigma^2\leq\frac{4\times67.62}{0.48}\\
\frac{270.48}{11.14}\leq\sigma^2\leq\frac{270.48}{0.48}\\
24.28\leq\sigma^2\leq56.35
検定統計量
身長や体重などについて検定を行う場合は、取りうる値がどのくらいの確率でその値となるかがわからないので、身長や体重の値を検定統計量と呼ばれる値に変換します。
統計量z
データの平均が$\bar{x}$、母平均が$\mu$、母分散が$\sigma^2$、サンプルサイズが$n$の場合、統計量$z$は以下のようになります。
z=\frac{\bar{x}-\mu}{\sqrt{\frac{\sigma^2}{n}}}
例えば、日本人男性の50人の体重の平均が70kg、分散が50で、有意水準を5%とした時、A君の体重65kgは平均体重と言ってよかどうかは以下のように計算できます。
z=\frac{70-65}{\sqrt{\frac{50}{50}}}=5
統計量$z$は5となり、また、有意水準5%なので標準正規分布から$z$値は、1.96となり、採択域には含まれないため、A君の体重65kgは平均体重ではないと結論づけられます。
統計量t
データの平均が$\bar{x}$、母平均が$\mu$、不偏分散が$s^2$、サンプルサイズが$n$の場合、統計量$z$は以下のようになります。
t=\frac{\bar{x}-\mu}{\sqrt{\frac{s^2}{n}}}
例えば、日本人男性をランダムに50人選び、その体重の平均が70kg、分散が50で、有意水準を5%とした時、日本人男性の体重80kgは平均体重と言ってよかどうかは以下のように計算できます。
t=\frac{70-80}{\sqrt{\frac{50}{50}}}=-10
統計量$t$は-10となり、また、サンプルサイズが30以上なので標準正規分布から有意水準が5%だと、$z$値は1.96となり、採択域には含まれないため、日本人男性の体重80kgは平均体重ではないと結論づけられます。
対応のある2標本t検定
同一の対象から抽出された「対」となる二つの標本は、対応のあるデータとなりますので、対応のあるデータの差$\bar{d}$を用いて母平均の検定(両側$t$検定や片側$t$検定)と同じように検定を行います。
t=\frac{\bar{d}-\mu}{\sqrt{\frac{s^2}{n}}}
例えば、被験者5人に対して薬の投与前と投与後の血圧を測定したところ、次の表のような結果が得られた場合、有意水準を0.05とすると、薬の投与によって血圧は下がったと言えるかどうかは以下のようになります。
被検者No. | 投与前の血圧 | 投与後の血圧 |
---|---|---|
1 | 175 | 150 |
2 | 125 | 135 |
3 | 170 | 145 |
4 | 155 | 150 |
5 | 145 | 140 |
| 被検者No. | 差(投与前-投与後) |
|--:|--:|--:|
| 1 |25|
| 2 |-10|
| 3 |25|
| 4 |5|
| 5 |5|
|平均|10|
s^2 = \frac{1}{n-1}\sum_{i=1}^{n} (x_i - \bar{x})^2\\
=\frac{1}{5-1}\times\{(25-10)^2+(-10-10)^2+(25-10)^2+(5-10)^2+(5-10)^2\}\\
=\frac{1}{5-1}\times(225+400+225+25+25)=225
$\mu=0$となります。
t=\frac{\bar{d}-\mu}{\sqrt{\frac{s^2}{n}}}=\frac{10-0}{\sqrt{\frac{225}{5}}}=1.49
$t_{0.05}(4)=2.1318$
よって、投薬によって血圧が下がったとは言えないと結論づけられます。
対応のない2標本t検定
異なる対象から抽出された2つの標本は、対応のないデータとなりますので、1群目の標本平均を$\bar{x_1}$、母平均を$\mu_1$、サンプルサイズを$n_1$、2群目の標本平均を$\bar{x_2}$、母平均を$\mu_2$、サンプルサイズを$n_2$、としたときに、次の式から算出される統計量$t$を使います。検定で用いるのは自由度$(n_1+n_2-2)$の$t$分布です。
t=\frac{\bar{x}_1-\bar{x}_2}{\sqrt{s^2\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}=\frac{\bar{x}_1-\bar{x}_2}{s\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}
例えば、ある学校の1組の生徒40人の平均点は65点、標準偏差は7点、2組の生徒43人の平均点は70点、標準偏差は10点で有意水準を0.05とした時、1組と2組の算数のテストの平均点に差はあると言えるかどうかは以下のようになります。
s^2_p = \frac{(40-1)\times7^2+(43-1)\times10^2}{30+43-2}=
\frac{1911+4200}{71}=86.07
t=\frac{\bar{x}_1-\bar{x}_2}{\sqrt{s^2\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}\\
=\frac{65-70}{\sqrt{86.07\left(\frac{1}{40}+\frac{1}{43}\right)}}
=\frac{-5}{2.03798} = -2.453
$t_{0.025}(81)=1.9897$
よって、帰無仮説は棄却され、対立仮説が採択されるので、1組と2組の算数のテストの平均点には差があると結論づけられます。
母比率の検定
母比率の検定では、標本比率が$\hat{p}$、母比率が$p_0$、サンプルサイズ$n$が十分に大きい場合、統計量$z$は以下のようになります。
z=\frac{\hat{p}-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}
例えば、あるサイコロを10,000回投げたときに1が出た回数が1,500回で有意水準を0.05とした場合、このサイコロはどの目も等しく出る歪みのないサイコロといえるかどうかは以下のようになります。
\hat{p}=\frac{1500}{10000}=\frac{3}{20}
z=\frac{\frac{3}{20}-\frac{1}{6}}{\sqrt{\frac{\frac{1}{6}(1-\frac{1}{6})}{10000}}}=\frac{-\frac{1}{60}}{0.0037266}=-4.47235
$Z_0.025=1.96$
よって、帰無仮説を棄却し、対立仮説を採択するという結果になり、このサイコロの1が出る確率は1/6ではなく、このサイコロは1の出やすさに関して歪んでいると結論づけられます。
二項分布の検定
二項分布の検定の場合、次の式から得られる統計量$z$は標準正規分布に従います。
z=\frac{X-np}{\sqrt{np(1-p)}}
例えば、あるサイコロを10,000回投げたときに1が出た回数が1,500回で有意水準を0.05とした場合、このサイコロはどの目も等しく出る歪みのないサイコロといえるかどうかは以下のようになります。
$np=10000/6=1666.67$
z=\frac{X-np}{\sqrt{np(1-p)}}=\frac{1500-1666.67}{\sqrt{1666.67(1-\frac{1}{6})}}=\frac{-166.67}{37.2678}=-4.472
$Z_0.025=1.96$
よって、帰無仮説を棄却し、対立仮説を採択するという結果になり、このサイコロの1が出る確率は1/6ではなく、このサイコロは1の出やすさに関して歪んでいると結論づけられます。
ポアソン分布の検定
確率変数$X$がポアソン分布に従い、サンプルサイズ$n$が十分に大きい時には、次の式は標準正規分布に従います。
z=\frac{X-n\lambda}{\sqrt{n\lambda}} = \frac{\frac{X}{n}-\lambda}{\sqrt{\frac{\lambda}{n}}}
例えば、1分に1個の不良品が出る工場があり、改善した結果、1時間に40個となった時、有意水準を0.05とした場合、1分間の不良品の発生頻度は低下したと言えるかどうかは以下のようになります。
この場合、$\lambda=60/60=1$、$\frac{X}{n}=40/60=0.6667$、$n=60$となるので、以下のようになります。
z= \frac{\frac{X}{n}-\lambda}{\sqrt{\frac{\lambda}{n}}}
=\frac{0.6667-1}{\sqrt{\frac{1}{60}}}
=\frac{-0.3333}{0.129}=-2.58
$Z_{0.05}=1.64$
よって、帰無仮説を棄却し、対立仮説を採択するという結果になるので、この工場ではでは1分に1回の不良品が発生するとは言えないので、工場の改善によって不良品の発生数は改善されたと結論づけられます。
適合度の検定
適合度の検定は、カイ二乗統計量によって行います。カイ二乗統計量は、実測値と理論値のズレの和によって求められます。また自由度はカテゴリー数$n-1$によって求められます。
\chi^2=\frac{(実測値_1-理論値_1)^2}{理論値_1}+\frac{(実測値_2-理論値_2)^2}{理論値_2}+\dots+\\ \frac{(実測値_n-理論値_n)^2}{理論値_n}
例えば、日本人の血液型の分布はA型が40%、O型が30%、B型が20%、AB型が10%であると言われていて、ランダムに選ばれた100人の血液型について次のようなデータが得られた時、このデータは日本人の血液型の分布と同じといえるかどうかは以下のようになります。有意水準は0.05とします。
血液型 | A型 | O型 | B型 | AB型 | 計 |
---|---|---|---|---|---|
度数 | 53 | 24 | 18 | 5 | 100 |
理論値は、
血液型 | A型 | O型 | B型 | AB型 | 計 |
---|---|---|---|---|---|
度数 | 40 | 30 | 20 | 10 | 100 |
ズレの和は、 |
\chi^2=\frac{(53-40)^2}{40}+\frac{(24-30)^2}{30}+\frac{(18-20)^2}{20}+\frac{(5-10)^2}{10}=4.225+1.2+0.2+2.5=8.125
$chi^2_{0.05}(3)$の片側検定は、$7.815$となっています。
よって、有意水準5%において、帰無仮説を棄却し、対立仮説を採択するという結果になるので、調査した血液型分布は日本人の血液型分布と一致しないと結論づけられます。
独立性の検定
独立性の検定は、2つ以上の分類基準を持つクロス集計表において、分類基準間に関連があるかどうかを検定することです。この場合も、カイ二乗分布を使用します。検定統計量は、理論値を求め、ズレを計算し、すべてのズレの和を計算することで求められます。
理論値は、$i$列目の度数の合計を「$f_i$」、$j$行目の度数合計を「$f_j$」、すべての度数の合計を$n$とすると、$i$列・$j$行目の「理論値」は以下の式から求められます。
理論値=\frac{f_i\times f_j}{n}
すべてのズレの和は以下のようになります。
\chi^2=\frac{(実測値_1-理論値_1)^2}{理論値_1}+\frac{(実測値_2-理論値_2)^2}{理論値_2}+\dots+\\ \frac{(実測値_n-理論値_n)^2}{理論値_n}
自由度は、$m$行、$n$行とした場合、$(m-1)\times(n-1)$となります。
例えば、ランダムに選ばれた男女各100人の血液型について次のようなデータが得られた時、性別と血液型に関連があるといえるかどうかは以下のようになります。
血液型 | A型 | O型 | B型 | AB型 | 計 |
---|---|---|---|---|---|
男性 | 50 | 24 | 17 | 9 | 100 |
女性 | 45 | 28 | 22 | 5 | 100 |
理論値は以下のようになります。
理論値=\frac{f_i\times f_j}{n}
血液型 | A型 | O型 | B型 | AB型 | 計 |
---|---|---|---|---|---|
男性 | 47.5 | 26 | 19.5 | 7 | 100 |
女性 | 47.5 | 26 | 19.5 | 7 | 100 |
ズレの和は以下のようになります。
\chi^2=\frac{(50-47.5)^2}{47.5}+\frac{(24-26)^2}{26}+\frac{(17-19.5)^2}{19.5}+\frac{(9-7)^2}{7}\\
+\frac{(45-47.5)^2}{47.5}+\frac{(28-26)^2}{26}+\frac{(22-19.5)^2}{19.5}+\frac{(5-7)^2}{7}\\
=0.1315+0.1538+0.3205+0.571+0.1315+0.1538+0.3205+0.571=2.3536
自由度は、$(2-1)\times(4-1)$となります。
$\chi^2_{0.05}(3)$は、片側検定なので、$7.815$となります。
よって、有意水準5%において、帰無仮説を棄却しない」という結果になるので、性別と血液型は独立である(関連がない)」と結論づけられます。
イェーツの補正
次のような2行×2列のクロス集計表があるとき、イェーツの補正を行ったカイ二乗値は下式から求められます。ただし、a, b, c, dは各度数を表し、N=a+b+c+dとします。
$T_1$ | $T_2$ | 計 | |
---|---|---|---|
$S_1$ | a | c | a+c |
$S_2$ | b | d | b+d |
計 | a+b | c+d | N |
\chi^2=\frac{N(|ad-bc|-\frac{N}{2})^2}{(a+b)(c+d)(a+c)(b+d)}
例えば、次のようなデータが得られた時、カイ二乗値は以下のようになります。
$T_1$ | $T_2$ | 計 | |
---|---|---|---|
$S_1$ | 1 | 2 | 3 |
$S_2$ | 3 | 4 | 5 |
計 | 4 | 6 | 10 |
\chi^2=\frac{10(|4-6|-\frac{10}{2})^2}{4\times6\times3\times5}=\frac{90}{360}=0.25
母比率の差の検定
母比率の差の検定では、サンプルサイズ$n$が十分に大きく、1群目の標本比率を$\hat{p_1}$、サンプルサイズを$n_1$、2群目の標本比率を$\hat{p_2}$、サンプルサイズを$n_2$とし、2つの標本比率を1つにまとめた標本比率(プールした標本比率)を$\hat{p}$とした時、次の式から得られる統計量$z$は標準正規分布に従います。
z=\frac{\hat{p_1}-\hat{p_2}}{\sqrt{\hat{p}(1-\hat{p})\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}
プールした標本比率$\hat{p}$は以下のようになります。
\hat{p}=\frac{n_1\hat{p_1}+n_2\hat{p_2}}{n_1+n_2}
例えば、あるテレビ番組の視聴率を調査したところ、関東地区では6000世帯中1500世帯、関西地区では3500世帯中720世帯が視聴していた場合、この2地区の視聴率に差があるかどうかは以下のようになります。有意水準は0.05とします。
関東地区 | 関西地区 | |
---|---|---|
調査世帯数 | 6000 | 3500 |
視聴世帯数 | 1500 | 720 |
\hat{p_1}=\frac{1500}{6000}=0.25\\
\hat{p_2}=\frac{720}{3500}=0.2057
\hat{p}=\frac{6000\times0.25+3500\times0.2057}{6000+3500}=\frac{1500+720}{9500}=0.23368
z=\frac{0.25-0.2057}{\sqrt{0.23368(1-0.23368)\left(\frac{1}{6000}+\frac{1}{3500}\right)}}\\
=\frac{0.0443}{\sqrt{0.17907\times\frac{7+12}{42000}}}=4.92
$Z_{0.025}$は$1.96$
よって、帰無仮説を棄却し、対立仮説を採択するという結果になるので、関東地区と関西地区とで視聴率に差があると結論づけられます。