本記事の内容
本記事では,ノンパラメトリック法の仮説検定で使われる検定統計量の期待値・分散とその導出 (式変形) を解説します。統計検定1級の試験でまれに出題される内容なので,この試験を受ける方に特に役に立てば何よりです。
本記事では,ノンパラメトリック法の期待値・分散の導出を行いますが,これはデータにタイ (同順位) がない場合の導出になります。タイがある場合はまた異なる結果になりますが,タイがある場合の導出は知らないので書きません(書けません)。統計検定1級対応の参考書「統計学」にはタイがある場合の期待値・分散の式が載っていた気がします。ただ,導出は無かったです。
ノンパラメトリック検定の種類
対応のない2群の (中央値の) 差の検定
・ウィルコクソンの順位和検定 (マン・ホイットニーのU検定)
・並べ替え検定
対応のある2群の (中央値の) 差の検定
・(ウィルコクソンの) 符号 (付き) 順位 (和) 検定
・符号検定
多群の (中央値の) 差の検定
・クラスカル・ウォリス検定
これらの検定手法のうち,本記事では,ウィルコクソンの順位和検定,ウィルコクソンの符号付き順位和検定,符号検定の3つの検定について解説していきます。
注意点
以降で導出する期待値・分散は,帰無仮説$H_0$が正しいとした下での期待値・分散になります。したがって,正確には求める期待値・分散は$E(〇〇|H_0), V(〇〇|H_0)$となりますが,省略して**$E(〇〇), V(〇〇)$のように表記します。**
ウィルコクソンの順位和検定
ウィルコクソンの順位和検定 (Wilcoxon's runk sum test) は対応のない2群の中央値の差を比較する検定です。比較したい2つの群 A, B のうちの片方の群,(今回は群Aを例にとる) の順位の和を検定統計量に使います。
前提・仮定
前提・仮定:2つの群の母集団分布の形状は同じ
帰無仮説
H_0:2つの群の母集団分布の位置は同じ
数式で表すならば,
H_0:一方の群の母集団分布の累積分布関数をF(x),もう一方をF(x-\delta)としたとき,\delta = 0
たまに,これ以外の帰無仮説を紹介しているインターネット記事がありますが,上記の帰無仮説が最も正確であると思われます (統計検定1級2012年応用共通大問3の模範解答がこの帰無仮説だった)。
検定統計量
ウィルコクソンの順位和検定に使う検定統計量は2群のうちの一方の群 (群A) の順位の和です。
W_A = \sum_{i=1}^{n_A}R_i
$n_A$:群Aのサンプル数
$n_B$:群Bのサンプル数
$N$:全サンプル数 $(=n_A + n_B)$
$R_i$: 全サンプルを小さい順に並べ直したときの,群Aのデータの中のi番目のサンプルの順位 (RankのR)
期待値・分散
E(W_A) = \frac{1}{2}n_A(n_A + n_B + 1) \\
V(W_A) = \frac{1}{12}n_An_B(n_A + n_B + 1)
期待値の導出
$R_i$は群Aのi番目のデータの順位を表すとする。$H_0$の下では,$R_i$は$1~N$までの順位を等確率にとりうるので,$R_i$は離散一様分布$DU(N)$に従うと見なせる ($DU$ = Discrete Uniform)。
($R_i$が離散一様分布に従うと言える理由は,前提:形状は同じ,H0:位置が同じ,この2つを考慮すると,2つの群の分布は完全に重なり,2つの群のデータは完全に入り混じるため,$R_i$は$1~N$のどの順位も等確率にとり得るから。)
\begin{eqnarray}
E(W_{A}) &=& E(\sum_{i=1}^{n_A}R_i) \\
&=& E(R_1 + R_2 + … + R_{n_A}) \\
&=& n_A \times E(R_i) \\
&=& n_A \times \frac{1}{2}(N + 1) \\
&=& \frac{1}{2}n_A(n_A + n_B + 1) \\
\end{eqnarray}
4行目→5行目 離散一様分布$DU(N)$の期待値=$\frac{1}{2}(N + 1)$より
5行目→6行目 $n_A + n_B = N$より
分散の導出
$R_i$は離散一様分布$DU(N)$に従うと見なせるので,
\begin{eqnarray}
V(W_{A}) &=& V(\sum_{i=1}^{n_A}R_i) \\
&=& V(R_1 + R_2 + … + R_{n_A}) \\
&=& \sum_{i=1}^{n_A}V(R_i) + \sum_{\substack{i,\, j\, = 1 \\ i \ne j}}^{n_A}Cov(R_i, R_j) \\
&=& n_A\ V(R_i) + n_A(n_A - 1)\ Cov(R_i, R_j)
\end{eqnarray}
2行目→3行目 独立でない確率変数の和の分散の公式より
3行目→4行目の第2項 共分散$Cov(R_i, R_j)$は,$R_1$~$R_{n_A}$のなかから2つ選びその共分散を計算する。$i, j$はそれぞれ1 ~ $n_A$まで取り得るので$i$と$j$の組み合わせは$n_A \times n_A$通り。ただし$i \ne j$という制限があるので,そこから$i = j$となる$n_A$個分を引き算すると$n_A \times n_A - n_A = n_A(n_A - 1)$個の共分散が存在することになる。
次にここで,第2項の$Cov(R_i, R_j)$を求める。( $DU(N)$の$Cov$。$DU(n_A)$の$Cov$ではないことに注意) $\sum_{i=1}^{N}R_i$の分散$V(\sum_{i=1}^{N}R_i)$を考えることによって,
\begin{eqnarray}
V(\sum_{i=1}^{N}R_i) &=& \sum_{i=1}^{N}V(R_i) + \sum_{\substack{i,\, j\, = 1 \\ i \ne j}}^{N}Cov(R_i, R_j) \\
V(\frac{1}{2}N(N+1)) &=& N \times V(R_i) + N(N-1)Cov(R_i, R_j) \\
0 &=& N \times \frac{N^2-1}{12} + N(N-1)Cov(R_i, R_j) \\
-N(N-1)Cov(R_i, R_j) &=& N \times \frac{N^2-1}{12} \\
Cov(R_i, R_j) &=& -\frac{N+1}{12}
\end{eqnarray}
2行目左辺 $\frac{1}{2}N(N+1)$は定数なので,$V(\frac{1}{2}N(N+1))=0$
\begin{eqnarray}
以上より,V(W_{A}) &=& n_A V(R_i) + n_A(n_A - 1)Cov(R_i, R_j) \\
&=& n_A \frac{N^2-1}{12} + n_A(n_A-1)(-\frac{N+1}{12}) \\
&=& \frac{n_A}{12}\{(N^2-1)-(n_A-1)(N+1)\} \\
&=& \frac{n_A}{12}(N+1)\{(N-1)-(n_A-1)\} \\
&=& \frac{n_A}{12}(N+1)(N-n_A) \\
&=& \frac{1}{12}n_An_B(n_A+n_B+1)
\end{eqnarray}
ウィルコクソンの符号付き順位和検定
ウィルコクソンの符号付き順位和検定 (Wilcoxon's signed rank sum test) は対応のある2群の中央値の差を比較する検定です。2群のデータの差をとり,差が0より大きいデータの順位の和を検定統計量とします。
この検定の期待値・分散の導出には考え方の違いにより2種類の導出があります。本記事ではそのうちの私が理解できた方(簡単な方)のみ紹介します。
前提・仮定
前提・仮定:差の母集団分布が中央値\thetaに関して左右対称
帰無仮説
H_0:差の母中央値を\thetaとして,\theta=0
検定統計量
符号付き順位の和$W^+$を検定統計量とします。
W^+ = \sum_{z_i>0}R_i
$n$:サンプル数
$z_i$:i番目のサンプルの差
$R_i$: 2群のデータの差をとって,絶対値の小さい順に並べ直したときの,i番目のデータの順位 (RankのR)
($W^+$を言葉で表すと,差が正になったデータの順位の和)
期待値・分散
E(W^+) = \frac{1}{4}n(n+1) \\
V(W^+) = \frac{1}{24}n(n+1)(2n+1)
期待値の導出
$R_i$は順位なので,1からnの値をとり得る。$H_0$の下では,各$z_i$は1/2の確率で正となる(前提・仮定の「左右対称」と,帰無仮説の「$\theta=0$」を考慮すると,各データはランダムに0より大きくなったり小さくなったりするから)。すなわち,各$R_i$(つまり各1からn)は1/2の確率で検定統計量$W^+$に計上されることになる。
以上のことを踏まえ,新たに以下のような確率変数$B_k$を考えると,$W^+=\sum_{k=1}^{n}k \times B_k$と新たに書き表すことができる。
$B_k = 1(順位kが正のとき), 0(順位kが負のとき)。すなわち,B_k~Ber(\frac{1}{2})$
($Ber$はベルヌーイ分布)
\begin{eqnarray}
E(W^+) &=& E(\sum_{z_i>0}R_i) \\
&=& E(\sum_{k=1}^{n}k \times B_k) \\
&=& E(1B_1+2B_2+3B_3+…nB_n) \\
&=& E(1B_k+2B_k+3B_k+…nB_k) \\
&=& (1+2+3+…+n) \times E(B_k) \\
&=& \frac{1}{2}n(n+1) \times \frac{1}{2} \\
&=& \frac{1}{4}n(n+1)
\end{eqnarray}
5行目→6行目 (1+2+3+…n)=1/2n(n+1)は数列の和の公式より。
$E(B_k)=1/2$はベルヌーイ分布の期待値の公式より。
分散の導出
\begin{eqnarray}
V(W^+) &=& V(\sum_{z_i>0}R_i) \\
&=& V(\sum_{k=1}^{n}k \times B_k) \\
&=& V(1^2B_1+2^2B_2+3^2B_3+…n^2B_n) \\
&=& E(1^2B_k+2^2B_k+3^2B_k+…n^2B_k) \\
&=& (1^2+2^2+3^2+…+n^2) \times V(B_k) \\
&=& \frac{1}{6}n(n+1)(2n+1) \times \frac{1}{4} \\
&=& \frac{1}{24}n(n+1)(2n+1)
\end{eqnarray}
5行目→6行目 数列の和の公式と,ベルヌーイ分布の分散の公式より。
符号検定
符号検定 (sign test) は1つ上のウィルコクソンの符号付き順位和検定と同じで,対応のある2群の中央値の差を比較する検定です。2群のデータの差をとり,差が0より大きいデータの個数を検定統計量とします。
前提・仮定
前提・仮定:なし
帰無仮説
H_0:差の母中央値を\thetaとして,\theta=0
検定統計量
差が0より大きいデータの個数を検定統計量とします。
T^+ = 差z_iが正のサンプルの個数
$n$:サンプル数
$z_i$:i番目のサンプルの差
期待値・分散
E(T^+) = \frac{1}{2}n \\
V(T^+) = \frac{1}{4}n
期待値の導出
帰無仮説の下では$z_i$は1/2の確率で正の値をとるので,$T^+$は二項分布$Bin(n, 1/2)$に従う。したがって,$E(T^+) = n \times \frac{1}{2} = \frac{1}{2}n$($Bin(n, p)$の期待値は$np$なので)
分散の導出
$T^+$は$Bin(n, 1/2)$に従うので,$V(T^+) = n \times 1/2 (1-1/2) = \frac{1}{4}n$($Bin(n, p)$の分散は$np(1-p)$なので)
最後に
ノンパラメトリック検定の検定統計量の期待値・分散の導出を解説している書籍やサイトはなかなか見かけません。だいたいが,結果のみしか書いてありません。本記事が,統計検定1級対策等でノンパラメトリック検定の期待値分散の導出が知りたいという人の助けになれば幸いです。