More than 5 years have passed since last update.

検定手法のまとめ

Last updated at 2020-02-01Posted at 2020-01-28

t検定

標本平均がある値と有意差があるかどうかを調べる。

2種類の標本平均に有意差があるかを調べる。ただ、2変量に対応関係があるかどうかで手法が少し異なる。詳細は下のリンクを参照のこと
statsモジュールの関数

3つ以上の水準間の平均値に差があるかどうかを検定する。
F比を求めた後に、そこからp値を計算する。
母集団分布が等分散正規分布であると仮定すると、F比の標本分布(F分布）はすでに明らかであるため、F分布の累積分布を用いる事によって、p値を得られる。

F比が大きいと、誤差に比べて効果の影響が大きいと判断される。

F比=\frac{効果の分散の大きさ}{誤差の分散の大きさ}

効果の大きさとはバイオリンプロット同士の距離。群間変動と呼ぶ。
誤差の大きさとはバイオリンプロットの大きさ。郡内変動と呼ぶ。

分割表に対するデータの独立性を検定する。

1.　観測度数と期待度数の差を求める。ここで、期待度数はすべて5以上であることが求められる。
以下が期待度数と観測度数の差を表したχ二乗統計量である。

\chi^2=\sum_{i=1}^{m}\sum_{j=1}^{n}\frac{(O_{ij}-E_{ij})^2}{E_{ij}}

上の式はデータ部分のみの分割表がm行n列としている。
Oが観測度数で、Eが期待度数である。

2.p値を求める。

χ二乗統計量の標本分布は、自由度１のχ二乗分布に漸近的に従うと証明されているため、χ二乗分布の累積分布関数　を利用して、p値を求めることができる。