統計検定準1級の勉強のための解説記事となります。下記にご了承いただける方のみ、お読みください。
以下の動画でも解説していますので、見やすいほうでご覧ください。
学習のポイント
問題の概要
問題の確率変数に関する情報を表にまとめると、以下のとおりとなります。
添え字$i$ | 1 | 2 | … | i | … |
---|---|---|---|---|---|
確率変数 | $X_1$ | $X_2$ | … | $X_i$ | … |
取りうる値 | $0, 1$ | $0, 1$ | … | $0, 1$ | … |
確率 | $P(X₁=0),$ $P(X₁=1)$ |
$P(X₂=0), $ $P(X₂=1)$ |
… | $P(X_i=0), $ $P(X_i=1)$ |
… |
ここで、1人目を選ぶ試行に対する確率変数($X_1$)、2人目を選ぶ試行に対する確率変数($X_2$)、・・・は、それぞれ別の確率変数です。
また、今回の問題においては、少ない母集団での非復元抽出のため、それぞれの選ぶ試行は独立ではありません。
解答
確率変数の2乗の期待値
求めたい期待値の式は、式①から、以下のように、立式できます。
E(X_i^2) =0^2 * P(X_i=0) + 1^2 * P(X_i=1)
よって、
E(X_i^2) = P(X_i=1)
を求めればよいことがわかります。
ここで、関東出身者を$A,B,C$とし、関東でない出身者を$D,E,F,G,H,I$とします。
関東出身者 | 関東以外の出身者 |
---|---|
$A,B,C$ | $D,E,F,G,H,I$ |
たとえば、2番目に選ばれた人($i=2$)が$A、B、C$のいずれかだとすると、残りの3つの枠($i=1, 3, 4$)には、選ばれていない8人の中から3人を配置することになります。つまり、$X_2=1$となる場合の表は以下となります。
$i=1$ | $i=2$ | $i=3$ | $i=4$ | |
---|---|---|---|---|
パターン1 | $A$以外 | $A$ | $i=1,2$以外 | $i=1,2,3$以外 |
パターン2 | $B$以外 | $B$ | $i=1,2$以外 | $i=1,2,3$以外 |
パターン3 | $C$以外 | $C$ | $i=1,2$以外 | $i=1,2,3$以外 |
ここで、$P(X_i = 1)$は、$i=2$でなくても、その順序に関係なく確率は等しくなるため、
P(X_i = 1)=P(X_1 = 1)=P(X_2 = 1)=P(X_3 = 1)=P(X_4 = 1)
となります。
以上のことから、$X_i = 1$となる場合の数は、初めに関東地方出身者3人のうち1人を並べた後、他の3人を残り8人から順序を考慮して並べればよく、$ {}_3P_1 \times {}_8P_3$です。
また、9人から4人を順序を考慮して並べる全体の場合の数は、${}_9P_4$です。
よって、$X_i = 1$となる確率は、
P(X_i = 1) = \frac{{}_3P_1 \times {}_8P_3}{{}_9P_4}= \frac{1}{3}
です。
よって、求めたい期待値は、
E(X_i^2) = P(X_i=1) = \frac{1}{3}
となります。
確率変数の積の期待値
式②から、
\begin{align}
E(X_i \times X_j) &= 0 \cdot 0 \cdot P(X_i=0, X_j=0) + 1 \cdot 0 \cdot P(X_i=1, X_j=0) \\
& + 0 \cdot 1 \cdot P(X_i=0, X_j=1) + 1 \cdot 1 \cdot P(X_i=1, X_j=1)
\end{align}
となるため、
E(X_i \times X_j) = P(X_i=1, X_j=1)
です。
ここで、たとえば、2番目と4番目に選ばれた人($i=2,4$)が$A、B、C$のいずれかのとき、残りの2つの枠($i=1,3$)には、選ばれていない7人の中から2人を配置することになります。これは、$X_2=1,X_4=1$の場合となり、表にすると以下のとおりとなります。
$i=1$ | $i=2$ | $i=3$ | $i=4$ | |
---|---|---|---|---|
パターン1 | $A,B$以外 | $A$ | $A,B$、$i=1$以外 | $B$ |
パターン2 | $A,C$以外 | $A$ | $A,C$、$i=1$以外 | $C$ |
パターン3 | $A,B$以外 | $B$ | $A,B$、$i=1$以外 | $A$ |
パターン4 | $B,C$以外 | $B$ | $B,C$、$i=1$以外 | $C$ |
パターン5 | $A,C$以外 | $C$ | $A,C$、$i=1$以外 | $A$ |
パターン6 | $B,C$以外 | $C$ | $B,C$、$i=1$以外 | $B$ |
ここで、ある2つの確率変数が、両方とも1となる確率はその順序に関係なく、
\begin{align}
P(X_i=1, X_j=1) &=P(X_1=1, X_2=1) = P(X_1=1, X_3=1) = P(X_1=1, X_4=1) \\
& = P(X_2=1, X_3=1) = P(X_2=1, X_4=1) = P(X_3=1, X_4=1)
\end{align}
となります。
よって、$X_i=1, X_j=1$の場合の数は、関東地方出身者3人のうち2人を順序を考慮して並べた後、他の2人を残り7人から順序を考慮して並べればよく、${}_3P_2 \times {}_7P_2$となります。
以上から、求めたい確率は、
P(X_i=1, X_j=1) = \frac{{}_3P_2 \times {}_7P_2}{{}_9P_4}= \frac{1}{12}
となります。
よって、
E(X_i \times X_j) = P(X_i=1, X_j=1)= \frac{1}{12}
となります。
標本平均の分散
求めたい分散は、シグマを展開し、定数$\frac{1}{4}$を2乗して分散の外に出すことによって、
V(\bar{X}) = V\left(\frac{1}{4}\sum_{i=1}^{4}X_i\right) = \frac{1}{16}V(X_1+X_2+X_3+X_4)
と表されます。
ここで、確率変数$X_1, X_2, ..., X_4$は独立でないことを踏まえると、式③より、
\begin{align}
V(\bar{X}) &= \frac{1}{16} [ V(X_1) + V(X_2) + V(X_3) + V(X_4) + 2(Cov(X_1, X_2) \\
& + Cov(X_1, X_3) + Cov(X_1, X_4) + Cov(X_2, X_3) + Cov(X_2, X_4) + Cov(X_3, X_4))
\end{align}
と式変形できます。
ここで、$X_i$の期待値は、
E[X_i] = \sum X_i P(X_i) = 0 \cdot P(X_i = 0) + 1 \cdot P(X_i = 1) =\frac{1}{3}
です。また、式④より、$X_i$の分散は、
V[X_i] = E[X_i^2] - (E[X_i])^2 =\frac{1}{3} - \left(\frac{1}{3}\right)^2= \frac{2}{9}
です。さらに、式⑤より、$X_i$と$X_j$の共分散は、
Cov(X_i, X_j) = E[X_i X_j] - E[X_i]E[X_j] = \frac{1}{12} - \frac{1}{3} \cdot \frac{1}{3} = -\frac{1}{36}
です。
上記の式から、分散、共分散は確率変数の添え字に限らず一定のため、
V(X_1) + V(X_2) + V(X_3) + V(X_4) = 4 \cdot V(X_i)
および
\begin{align}
\text{Cov}(X_1, X_2) &+ \text{Cov}(X_1, X_3) + \text{Cov}(X_1, X_4) + \text{Cov}(X_2, X_3) \\
& + \text{Cov}(X_2, X_4) + \text{Cov}(X_3, X_4) = 6 \cdot \text{Cov}(X_i, X_j)
\end{align}
です。よって、$V(\bar{X})$は、
V(\bar{X}) = \frac{1}{16} \left[ 4 \cdot V(X_i) + 6 \cdot \text{Cov}(X_i, X_j) \right]
となります。
よって、
V(\bar{X}) =\frac{1}{16} \left( 4 \cdot \frac{2}{9} +2 \cdot 6 \cdot \left(-\frac{1}{36}\right)\right)= \frac{5}{144}