More than 5 years have passed since last update.

②推定・検定

Last updated at 2020-09-08Posted at 2020-09-08

0 基本用語

母集団：調査や研究の対象となるものの全体。

有限母集団：有限の要素からなる母集団(例：日本人の人口など)
無限母集団：無限に繰り返すことができる限りのないデータ(例：さいころを投げて出る目のデータなど)
標本(サンプル)：母集団から抽出したデータの集まり。
抽出：母集団から一部を選んで標本すること。
推測統計学：母集団から抽出された標本を用いて、母集団の性質を推測すること。
記述統計学：取得した手元データを用いて、データの特徴をグラフや表などを用いてわかりやすく表現すること。
全数調査：調査対象が母集団全体。
標本調査：調査対象が母集団の一部。
復元抽出法：一度抽出された標本を母集団の中に戻す抽出方法。
非復元抽出法：一度抽出された標本を母集団の中に戻さない抽出方法。
標本の大きさ(サンプルサイズ)：(例：100人など)
標本数(サンプル数)：(例：調査を5回など)
母数：母集団を特徴づける値のことで、例えば母平均（母集団の平均）や母分散（母集団の分散）など。

1 標本の抽出方法

単純無作為抽出

母集団から「完全に」「ランダムに」標本を抽出すること。

層化抽出法（層別抽出法）

母集団をあらかじめいくつかの層（グループ）に分けておき、
各層の中から必要な数の調査対象を無作為に抽出する方法。

【メリット】
母集団内情報（年齢別、性別など）の比較を行える、母集団の推測の精度が増す、
各層において分布が大きく異なる場合に使うことができる
【デメリット】
母集団の構成情報を事前に知っておく必要がある

クラスター抽出法（集落抽出法）

①母集団を、小集団である「クラスター（集落）」に分ける
②分けられたクラスターの中から、いくつかのクラスターを無作為抽出する
③それぞれのクラスターにおいて全数調査を行う

【メリット】
クラスターの情報（例えば高校名など）さえあれば抽出することができるので、時間や手間を節約できる。
【デメリット】
同じクラスターに属する調査対象は似た性質を持ちやすいため、標本に偏りが生じる可能性がある。

多段抽出法

母集団をいくつかのグループに分け、そこから無作為抽出でいくつかグループを選び、
さらにその中から無作為抽出でいくつかのグループを選び・・・という操作を繰り返して、
最終的に選ばれたグループの中から調査対象を無作為抽出する方法。

【メリット】
コストを低く抑えられる、抽出効率が高い
【デメリット】
サンプルサイズが小さい場合、標本に偏りが生じる可能性がある

系統抽出法

通し番号をつけた名簿を作成し、1番目の調査対象を無作為に選び、2番目以降の調査対象を一定の間隔で抽出する方法。

【メリット】
単純無作為抽出より手間や時間やコストが掛からない
【デメリット】
名簿の並び順に何らかの周期があると標本に偏りが生じる可能性がある

2 研究デザイン

2-1 実験研究

研究対象に対して何らかの介入（投薬や治療など）を行い、その効果を検証するための研究デザインのこと。

ランダム化比較試験（RCT：Randomized Controlled Trial)（前向き研究）

実験群と対照群への割り付けをランダムに行い、介入の効果を調べる研究のこと。

クロスオーバー試験（前向き研究）

対象者を実験群、対象群の2群に分けて介入と比較を行い、その後一定の期間をあけてから
実験群と対照群を入れ替えて再度介入と比較を行う研究のこと。

2-2 観察研究

研究対象に対して介入（投薬や治療など）を行わなずに、観察によってデータを集めて解析を行う研究デザインのこと。

横断研究

ある1時点において断面的調査を行い、要因と結果の関連を調べる研究のこと。
過去に遡った調査や、未来に向かって調査を行うことはない。

コホート研究（前向き研究/後ろ向き研究）

異なる特性を持つ対象集団（コホート）において、ある特性を持つ/暴露がある群とそうではない群に分け、
時間の流れに沿って疾患の発生や改善などを観察し、その特性/暴露と疾患との関係を調べる研究のこと。

ケースコントロール研究（症例対照研究）（後ろ向き研究）

ある病気に罹患している群と対照群に対して、その病気の特性/暴露の有無との関係を調べる研究のこと。

3 大数の法則

確率$p$で起こる事象において、試行回数を増やすほど、その事象が実際に起こる確率は$p$に近づく。
「母平均が$μ$である集団から標本を抽出する場合、サンプルサイズ（＝標本の大きさ）が大きくなるにつれて、標本平均は母平均$μ$に近づく」

4 中心極限定理

母集団が$N(\mu,\sigma^2)$に従う場合、従わない場合においても、
抽出するサンプルサイズ$n$が大きくなるにつれて、
標本平均の分布は「平均$\mu$、分散$\sigma^2/n$の正規分布」に近づく。
サンプルサイズが大きいほどその標本平均のばらつきが小さくなり、
標本平均が母平均のより近くに集まる（平均値をより正確に推測できる）ことを表している。

標準化

$N(\mu,\sigma^2)$に従う母集団から$n$個のサンプルを抽出した平均値$\overline{X}$について
標準化を行った$z$はサンプルサイズが大きくなるにつれて$N(0,1^2)$に近づく。

z=\frac{\bar{x}-\mu}{\sqrt{\frac{\sigma^{2}}{n}}}=\frac{\bar{x}-\mu}{\frac{\sigma}{\sqrt{n}}}

5 推定

母集団を特徴づける母数（パラメーター：平均など）を統計学的に推測すること。

推定量：パラメータを推定するために利用する数値の計算方法や計算式のこと。
推定値：実際に試行を行った結果から計算した値。

5-1 点推定

平均値などを1つの値で推定すること。
母集団から抽出された標本を用いて母集団を特徴づけるパラメータ（母数）を推測すること。

標本分散

標本分散は一致推定量ではあるものの不偏推定量ではない。
$n$が十分に大きくない場合には標本分散の期待値は母分散に一致せず、母分散より小さくなる。

\widehat{\sigma}^{2}=\frac{1}{n} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}

不偏分散

不偏分散は一致性と不偏性をもつ推定量。

s^{2}=\frac{n}{n-1} \times \frac{1}{n} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}=\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}

一致性：$n$が大きくなれば、推定量がだんだんと真のパラメータに近づく性質。
不偏性：推定量の期待値がパラメータに一致する必要がある。

標準偏差

s=\sqrt{\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}

標準誤差

推定量の標準偏差であり、標本から得られる推定量そのもののバラつき（＝精度）を表すもの。

S E=\frac{s}{\sqrt{n}}=\frac{\sqrt{\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}}{\sqrt{n}}

5-2 区間推定

平均値などをある区間でもって推定すること。
母集団の従う分布が正規分布であると仮定できるときに、
標本から得られた値を使ってある区間でもって母平均などの母数を推定する方法。

信頼区間(CI)：ある確率（信頼係数）のもとで母数がその内に含まれると推定された区間のこと。
信頼係数：母数を区間推定するときに母数が信頼区間内に含まれる確率のこと。

5-2-1 母平均の区間推定

母分散が分かっている場合（母分散既知）

母分散$σ^2$の値を使い、標準正規分布を用いて信頼区間を算出する。
1 標本平均$\bar{x}$を求める。
2 標本平均の標準化を行う。

\frac{\bar{x}-\mu}{\sqrt{\frac{\sigma^{2}}{n}}}

3 標準正規分布表から点をパーセント点を調べる。
4 信頼区間を求める。

\bar{x}-z_{\frac{1-\alpha}{2}} \times \sqrt{\frac{\sigma^{2}}{n}} \leq \mu \leq \bar{x}+z_{\frac{1-\alpha}{2}} \times \sqrt{\frac{\sigma^{2}}{n}}

母分散が分からない場合（母分散未知）

不偏分散$s^2$の値を使い、t分布を用いて信頼区間を算出する。
1 標本平均$\bar{x}$と不偏分散$s^2$を求める。
2 統計量$t$を計算する。

t=\frac{\bar{x}-\mu}{\sqrt{\frac{s^{2}}{n}}}

3 t分布表（自由度は$n-1$）からパーセント点を調べる。
4 信頼区間を求める

\bar{x}-t_{\alpha / 2}(n-1) \times \sqrt{\frac{s^{2}}{n}} \leq \mu \leq \bar{x}+t_{\alpha / 2}(n-1) \times \sqrt{\frac{s^{2}}{n}}

自由度：ある変数において自由な値をとることのできるデータの数。

母平均の差の信頼区間

対応があるデータの場合

1 それぞれのデータ差の平均値$\bar{x}_{d}$と不偏分散$s^2_d$を求める。
2 t分布表（自由度は$n−1$）からパーセント点を調べる。
3 信頼区間を求める。

\bar{x}_{d}-t_{\alpha / 2}(n-1) \times \sqrt{\frac{s_{d}^{2}}{n}} \leq \mu_{d} \leq \bar{x}_{d}+t_{\alpha / 2}(n-1) \times \sqrt{\frac{s_{d}^{2}}{n}}

対応がないデータの場合

1 それぞれのデータの平均値と不偏分散を求める。
2 それぞれのデータから算出される分散をまとめた分散$s^2_p$（プールされた分散）を、次の式から算出。

s_{p}^{2}=\frac{\left(n_{1}-1\right) s_{1}^{2}+\left(n_{2}-1\right) s_{2}^{2}}{n_{1}+n_{2}-2}

3 t分布表（自由度は$n_1+n_2−2$）からパーセント点を調べる。
4 信頼区間を求める。

\begin{array}{l}
\left(\bar{x}_{1}-\bar{x}_{2}\right)-t_{\alpha / 2}\left(n_{1}+n_{2}-2\right) \times \sqrt{s_{p}^{2}\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)} \leq \mu_{1}-\mu_{2} \leq\left(\bar{x}_{1}-\bar{x}_{2}\right)+ \\
t_{\alpha / 2}\left(n_{1}+n_{2}-2\right) \times \sqrt{s_{p}^{2}\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)}
\end{array}

5-2-2 母比率の区間推定

二項分布に従う確率変数$X$の期待値と分散

\begin{aligned}
&E(X)=n p\\
&V(X)=n p(1-p)
\end{aligned}

$X$が二項分布に従う場合、$X$を標準化した値$Z$は$n$が十分に大きい場合、標準正規分布に従う。

Z=\frac{X-n p}{\sqrt{n p(1-p)}}\\

Z=\frac{X-n p}{\sqrt{n p(1-p)}}=\frac{\frac{1}{n}}{\frac{1}{n}} \times \frac{X-n p}{\sqrt{n p(1-p)}}=\frac{\frac{X}{n}-p}{\sqrt{\frac{p(1-p)}{n}}}=\frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}\\

1 サンプルサイズ$n$と推定値$\widehat{p}$を求める
2 統計量$Z$を計算する

Z=\frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}

3 標準正規分布表からパーセント点を調べる。
4 信頼区間を求める。

\widehat{p}-z_{\frac{\alpha}{2}} \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}} \leq p \leq \widehat{p}+z_{\frac{\alpha}{2}} \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}

必要なサンプルサイズの算出

信頼区間の幅が最も大きくなるのは$\widehat{p}=0.5$の場合。

2 \times z_{\frac{1-\alpha}{2}} \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}

母比率の差の信頼区間

1 サンプルサイズ$n_1,n_2$と標本比率$p_1,p_2$を求める
2 標準正規分布表からパーセント点を調べる。
3 信頼区間を求める。

\begin{array}{l}
(\widehat{p_{1}}-\widehat{p_{2}})-z_{\frac{\alpha}{2}} \times \sqrt{\frac{\widehat{p_{1}}(1-\widehat{p_{1}})}{n_{1}}+\frac{\widehat{p_{2}}(1-\widehat{p_{2}})}{n_{2}}} \leq p_{1}-p_{2} \leq(\widehat{p_{1}}-\widehat{p_{2}})+z_{\frac{\alpha}{2}} \times \\
\sqrt{\frac{\widehat{p_{1}}(1-\widehat{p_{1}})}{n_{1}}+\frac{\widehat{p_{2}}(1-\widehat{p_{2}})}{n_{2}}}
\end{array}

5-2-3 母分散の区間推定

1 標本の不偏分散$s^2$を求める。
2 カイ二乗分布表（自由度は$n−1$）からパーセント点を調べる。
3 信頼区間を求める。

\frac{(n-1) s^{2}}{\chi_{\alpha / 2}^{2}(n-1)} \leq \sigma^{2} \leq \frac{(n-1) s^{2}}{\chi_{1-\alpha / 2}^{2}(n-1)}

6 検定

母集団から抽出された標本の統計量に関する仮説が正しいかを統計学的に判定すること。
最初に仮説を立て、実際に起こった結果を確率的に検証し、結論を導くという手順で行う。

背理法：最初に仮説を設定し、仮説が正しいとした条件で考えて矛盾が起こった場合に仮説が間違っていると判断する方法。
帰無仮説$H_0$：検定の最初に立てる仮説のこと。この仮説を元に検定を行い結論を導く。
対立仮説$H_1$：帰無仮説に対する仮説のこと。本来証明したい仮説。
検定統計量：帰無仮説が正しいと仮定したときに、観測した事象よりも稀なことが起こる確率を計算するための値。
$P$値：帰無仮説が正しいとした仮定とき、観測した事象よりも極端なことが起こる確率。
棄却：仮説を捨てること。
棄却域：帰無仮説が棄却される領域。
採択域：帰無仮説が棄却されない領域。
両側検定：帰無仮説が$H_0:\mu_A=\mu_B$、対立仮説が$H_1:\mu_A\neq\mu_B$であるときに行う検定のこと。
片側検定：帰無仮説が$H_0:\mu_A=\mu_B$のときに、対立仮説が$H_1:\mu_A>\mu_B$または$H_2:\mu_A<\mu_B$であるときに行う検定のこと。

第1種の過誤
本当は帰無仮説$H_0$が正しいのに、誤って$H_0$を棄却してしまうこと。

有意水準($a$)：帰無仮説を棄却するための基準となる確率。検定を行う前に設定しておく。

≪意味≫
有意水準を0.05に設定するということ
=「5%以下の確率で起こる事象は、100回に5回以下しか起こらない事象だ。したがってこのようなまれな事象が起こった場合、偶然起こったものではないとしてしまおう」という意味。
本当は帰無仮説$H_0$が正しいのに、誤って$H_0$を棄却してしまう確率とも言える。

第2種の過誤
対立仮説$H_1$が正しいときに、誤って帰無仮説$H_0$を棄却しない確率のこと。

検出力($1-\mathcal{B}$)：帰無仮説$H_0$が正しくないときに、正しく$H_0$を棄却する確率。

6-1 母平均の検定

1 帰無仮説$H_0$と対立仮説$H_1$を立てる。
2 有意水準$a$を設定する。
3 適切な検定統計量を決める。

母分散既知の場合　z=\frac{\bar{x}-\mu}{\sqrt{\frac{\sigma^{2}}{n}}}\\
母分散未知の場合　t=\frac{\bar{x}-\mu}{\sqrt{\frac{s^{2}}{n}}}=\frac{\bar{x}-\mu}{\frac{s}{\sqrt{n}}}

4 棄却ルール(両側or片側検定)を決め、統計数値表から値を読み取る。
5 検定統計量を元に結論を出す。

2標本t検定

それぞれの母集団から抽出した標本の平均に差があるかどうかを検定すること。

対応があるデータの場合

「対応のあるデータの差」を用いて検定を行う。
差を用いると実質は1標本の検定と同じやり方になる。

※差が0かどうかを検定するため、$\mu=0$になる。

対応がないデータの場合

1 帰無仮説$H_0$と対立仮説$H_1$を立てる。
2 有意水準$a$を設定する。
3 2つの標本をプールした（まとめた）分散を算出。

s^{2}=\frac{\left(n_{1}-1\right) \times s_{1}^{2}+\left(n_{2}-1\right) \times s_{2}^{2}}{n_{1}+n_{2}-2}

4 適切な検定統計量を決める。(母分散未知の場合)

t=\frac{\bar{x}_{1}-\bar{x}_{2}-\left(\mu_{1}-\mu_{2}\right)}{\sqrt{s^{2}\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)}}=\frac{\bar{x}_{1}-\bar{x}_{2}-\left(\mu_{1}-\mu_{2}\right)}{s \sqrt{\frac{1}{n_{1}}+\frac{1}{n_{2}}}}

帰無仮説である「母平均が等しい」という仮説が正しいとすると、$(\mu_1-\mu_2)=0$になる

t=\frac{\bar{x}_{1}-\bar{x}_{2}}{\sqrt{s^{2}\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)}}=\frac{\bar{x}_{1}-\bar{x}_{2}}{s \sqrt{\frac{1}{n_{1}}+\frac{1}{n_{2}}}}

5 棄却ルール(両側or片側検定)を決め、統計数値表(自由度は$n_1+n_2−2$)から値を読み取る。
6 検定統計量を元に結論を出す。

6-2 母比率の検定

1 帰無仮説$H_0$と対立仮説$H_1$を立てる。
2 有意水準$a$を設定する。
3 適切な検定統計量を決める。$p_0$は母比率、$\widehat{p}$は標本比率。

z=\frac{\widehat{p}-p_{0}}{\sqrt{\frac{p_{0}\left(1-p_{0}\right)}{n}}}

4 棄却ルール(両側or片側検定)を決め、標準正規分布表から値を読み取る。
5 検定統計量を元に結論を出す。

母比率の差の検定

2つの標本から得た標本比率を使って母比率が等しいかを検定する方法

1 帰無仮説$H_0$と対立仮説$H_1$を立てる。
2 有意水準$a$を設定する。
3 プールした標本比率$\widehat{p}$を求める。

\widehat{p}=\frac{n_{1} \widehat{p}_{1}+n_{2} \widehat{p}_{2}}{n_{1}+n_{2}}

4 適切な検定統計量を決める。

z=\frac{\widehat{p}_{1}-\widehat{p}_{2}}{\sqrt{\widehat{p}(1-\widehat{p})\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)}}

5 棄却ルール(両側or片側検定)を決め、標準正規分布表から値を読み取る。
6 検定統計量を元に結論を出す。

6-3 二項分布を用いた検定

1 帰無仮説$H_0$と対立仮説$H_1$を立てる。
2 有意水準$a$を設定する。
3 適切な検定統計量を決める。

z=\frac{X-n p}{\sqrt{n p(1-p)}}

4 棄却ルール(両側or片側検定)を決め、標準正規分布表から値を読み取る。
5 検定統計量を元に結論を出す。

6-4 ポアソン分布を用いた検定

1 帰無仮説$H_0$と対立仮説$H_1$を立てる。
2 有意水準$a$を設定する。
3 適切な検定統計量を決める。

z=\frac{\frac{X}{n}-\lambda}{\sqrt{\frac{\lambda}{n}}}

4 棄却ルール(両側or片側検定)を決め、標準正規分布表から値を読み取る。
5 検定統計量を元に結論を出す。

6-5 適合度の検定

実測度数と理論度数が一致するかどうかを検定する方法。

1 帰無仮説$H_0$と対立仮説$H_1$を立てる。
2 有意水準$a$を設定する。
3 理論値からの実測値のズレを2乗したものを、理論値の値で割り、総和をとる。

\chi^{2}=\sum_{i=a}^{b}\frac{(実測値-理論値)^{2}}{理論値}

4 カイ二乗分布表(自由度が$n-1$)から値を読み取る。片側検定で行う。
5 検定統計量を元に結論を出す。

6-6 独立性の検定

分類基準間に関連があるかどうかを検定すること。

1 帰無仮説$H_0$と対立仮説$H_1$を立てる。
2 有意水準$a$を設定する。
3 理論値を算出する

\frac{f_{i:} \times f_{j}}{n}

4 理論値からの実測値のズレを2乗したものを、理論値の値で割り、総和をとる。

\chi^{2}=\sum_{i=a}^{b}\frac{(実測値-理論値)^{2}}{理論値}

5 カイ二乗分布表(自由度が$(m-1)\times(n-1)$)から値を読み取る。片側検定で行う。
(縦が$m$行、横が$n$列のクロス集計表の場合)
6 検定統計量を元に結論を出す。

イェーツの補正

2行×2列のクロス集計表のデータに対して行われる補正で、
離散型分布を連続型分布（カイ二乗分布や正規分布）に近似させて統計的検定を行う

\chi^{2}=\frac{N\left(|a d-b c|-\frac{N}{2}\right)^{2}}{(a+b)(c+d)(a+c)(b+d)}

6-7 等分散性の検定

1 帰無仮説(分散は等しい)$H_0$と対立仮説$H_1$を立てる。
2 有意水準$a$を設定する。
3 適切な検定統計量を決める。(2つの分散のうち、大きな値の方を分子に)

F=\frac{s_{1}^{2}}{s_{2}^{2}}

4 棄却ルール(両側or片側検定)を決め、F分布表(自由度$m,n$)から値を読み取る。
5 検定統計量を元に結論を出す。

6-8 Welchのt検定

2標本t検定と同様に平均値の差の検定方法で、
2標本t検定とは異なり2標本の母分散が等しいとは限らない場合に使う。

t=\frac{\bar{x}_{1}-\bar{x}_{2}}{\sqrt{\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}}}

多重性の問題：検定を複数回行うと、第1種の過誤の確率が大きくなるという問題。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up