#t検定
##1変量のとき
標本平均がある値と有意差があるかどうかを調べる。
##2変量のとき
2種類の標本平均に有意差があるかを調べる。ただ、2変量に対応関係があるかどうかで手法が少し異なる。詳細は下のリンクを参照のこと
statsモジュールの関数
#分散分析
3つ以上の水準間の平均値に差があるかどうかを検定する。
F比を求めた後に、そこからp値を計算する。
母集団分布が等分散正規分布であると仮定すると、F比の標本分布(F分布)はすでに明らかであるため、F分布の累積分布を用いる事によって、p値を得られる。
##F比
F比が大きいと、誤差に比べて効果の影響が大きいと判断される。
F比=\frac{効果の分散の大きさ}{誤差の分散の大きさ}
効果の大きさとはバイオリンプロット同士の距離。群間変動と呼ぶ。
誤差の大きさとはバイオリンプロットの大きさ。郡内変動と呼ぶ。
#χ二乗検定
分割表に対するデータの独立性を検定する。
1. 観測度数と期待度数の差を求める。ここで、期待度数はすべて5以上であることが求められる。
以下が期待度数と観測度数の差を表したχ二乗統計量である。
\chi^2=\sum_{i=1}^{m}\sum_{j=1}^{n}\frac{(O_{ij}-E_{ij})^2}{E_{ij}}
上の式はデータ部分のみの分割表がm行n列としている。
Oが観測度数で、Eが期待度数である。
2.p値を求める。
χ二乗統計量の標本分布は、自由度1のχ二乗分布に漸近的に従うと証明されているため、χ二乗分布の累積分布関数 を利用して、p値を求めることができる。
##参考ページ
https://qiita.com/kanamae879123/items/ec1226fc6d0ba789ae65
https://qiita.com/kanamae879123/items/2502258737a7d8e181c6