0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【準1級】統計学実践ワークブック 例題5.3  標本平均の分散

Last updated at Posted at 2024-12-20

統計検定準1級の勉強のための解説記事となります。下記にご了承いただける方のみ、お読みください。

注意
  • 著作権の都合により問題文は掲載せず解説のみの記述となります。
  • 独自の解釈により、不適切な表現がある可能性があります。

以下の動画でも解説していますので、見やすいほうでご覧ください。

学習のポイント

確率変数の2乗の期待値の式

\begin{align}
E(X_i^2) & = a_1^2 · P(X_i = a_1)+ a_2^2 · P(X_i = a_2) \\
 &    + ... + a_n^2 · P(X_i = a_n) ・・・①
\end{align}

確率変数の積の期待値の式


E(X_i \times X_j) = \sum_{x_i} \sum_{x_j} x_i x_j P(X_i = x_i, X_j = x_j) ・・・②

分散・共分散の公式

確率変数$X_1, X_2, ..., X_n$が独立でない場合、


V\left(\sum_{i=1}^n X_i\right) = \sum_{i=1}^n V(X_i) + 2 \sum_{i=1}^{n-1} \sum_{j=i+1}^n Cov(X_i, X_j) ・・・③

分散の公式

V[X_i] = E[X_i^2] - (E[X_i])^2・・・④

共分散の公式

Cov(X, Y) = E[XY] - E[X]E[Y] ・・・⑤

解法ノート

image.png

image.png

image.png

問題の概要

問題の確率変数に関する情報を表にまとめると、以下のとおりとなります。

添え字$i$ 1 2 i
確率変数 $X_1$ $X_2$ $X_i$
取りうる値 $0, 1$ $0, 1$ $0, 1$
確率 $P(X₁=0),$
$P(X₁=1)$
$P(X₂=0), $
$P(X₂=1)$
$P(X_i=0), $
$P(X_i=1)$

ここで、1人目を選ぶ試行に対する確率変数($X_1$)、2人目を選ぶ試行に対する確率変数($X_2$)、・・・は、それぞれ別の確率変数です。
また、今回の問題においては、少ない母集団での非復元抽出のため、それぞれの選ぶ試行は独立ではありません。

解答

確率変数の2乗の期待値

求めたい期待値の式は、式①から、以下のように、立式できます。

E(X_i^2) =0^2 * P(X_i=0) + 1^2 * P(X_i=1) 

よって、

E(X_i^2) = P(X_i=1) 

を求めればよいことがわかります。

ここで、関東出身者を$A,B,C$とし、関東でない出身者を$D,E,F,G,H,I$とします。

関東出身者 関東以外の出身者
$A,B,C$ $D,E,F,G,H,I$

たとえば、2番目に選ばれた人($i=2$)が$A、B、C$のいずれかだとすると、残りの3つの枠($i=1, 3, 4$)には、選ばれていない8人の中から3人を配置することになります。つまり、$X_2=1$となる場合の表は以下となります。

$i=1$ $i=2$ $i=3$ $i=4$
パターン1 $A$以外 $A$ $i=1,2$以外 $i=1,2,3$以外
パターン2 $B$以外 $B$ $i=1,2$以外 $i=1,2,3$以外
パターン3 $C$以外 $C$ $i=1,2$以外 $i=1,2,3$以外

ここで、$P(X_i = 1)$は、$i=2$でなくても、その順序に関係なく確率は等しくなるため、

P(X_i = 1)=P(X_1 = 1)=P(X_2 = 1)=P(X_3 = 1)=P(X_4 = 1)

となります。

以上のことから、$X_i = 1$となる場合の数は、初めに関東地方出身者3人のうち1人を並べた後、他の3人を残り8人から順序を考慮して並べればよく、$ {}_3P_1 \times {}_8P_3$です。

また、9人から4人を順序を考慮して並べる全体の場合の数は、${}_9P_4$です。

よって、$X_i = 1$となる確率は、

P(X_i = 1) = \frac{{}_3P_1 \times {}_8P_3}{{}_9P_4}= \frac{1}{3}

です。

よって、求めたい期待値は、

E(X_i^2) = P(X_i=1) = \frac{1}{3}

となります。

確率変数の積の期待値

式②から、

\begin{align}
E(X_i \times X_j)   &= 0 \cdot 0 \cdot P(X_i=0, X_j=0) + 1 \cdot 0 \cdot P(X_i=1, X_j=0)  \\
 & + 0 \cdot 1 \cdot P(X_i=0, X_j=1) + 1 \cdot 1 \cdot P(X_i=1, X_j=1)
\end{align}

となるため、

E(X_i \times X_j) = P(X_i=1, X_j=1)

です。

ここで、たとえば、2番目と4番目に選ばれた人($i=2,4$)が$A、B、C$のいずれかのとき、残りの2つの枠($i=1,3$)には、選ばれていない7人の中から2人を配置することになります。これは、$X_2=1,X_4=1$の場合となり、表にすると以下のとおりとなります。

$i=1$ $i=2$ $i=3$ $i=4$
パターン1 $A,B$以外 $A$ $A,B$、$i=1$以外 $B$
パターン2 $A,C$以外 $A$ $A,C$、$i=1$以外 $C$
パターン3 $A,B$以外 $B$ $A,B$、$i=1$以外 $A$
パターン4 $B,C$以外 $B$ $B,C$、$i=1$以外 $C$
パターン5 $A,C$以外 $C$ $A,C$、$i=1$以外 $A$
パターン6 $B,C$以外 $C$ $B,C$、$i=1$以外 $B$

ここで、ある2つの確率変数が、両方とも1となる確率はその順序に関係なく、

\begin{align}
P(X_i=1, X_j=1)  &=P(X_1=1, X_2=1) = P(X_1=1, X_3=1) = P(X_1=1, X_4=1) \\
 &  = P(X_2=1, X_3=1) = P(X_2=1, X_4=1) = P(X_3=1, X_4=1)
\end{align}

となります。

よって、$X_i=1, X_j=1$の場合の数は、関東地方出身者3人のうち2人を順序を考慮して並べた後、他の2人を残り7人から順序を考慮して並べればよく、${}_3P_2 \times {}_7P_2$となります。

以上から、求めたい確率は、

P(X_i=1, X_j=1) = \frac{{}_3P_2 \times {}_7P_2}{{}_9P_4}= \frac{1}{12}

となります。

よって、

E(X_i \times X_j) = P(X_i=1, X_j=1)= \frac{1}{12}

となります。

標本平均の分散

求めたい分散は、シグマを展開し、定数$\frac{1}{4}$を2乗して分散の外に出すことによって、

V(\bar{X}) = V\left(\frac{1}{4}\sum_{i=1}^{4}X_i\right) = \frac{1}{16}V(X_1+X_2+X_3+X_4)

と表されます。

ここで、確率変数$X_1, X_2, ..., X_4$は独立でないことを踏まえると、式③より、

\begin{align}
V(\bar{X})  &=  \frac{1}{16} [ V(X_1) + V(X_2) + V(X_3) + V(X_4)  + 2(Cov(X_1, X_2)  \\
 & + Cov(X_1, X_3) + Cov(X_1, X_4) + Cov(X_2, X_3) + Cov(X_2, X_4) + Cov(X_3, X_4))
\end{align}

と式変形できます。

ここで、$X_i$の期待値は、

E[X_i] = \sum X_i P(X_i) = 0 \cdot P(X_i = 0) + 1 \cdot P(X_i = 1) =\frac{1}{3} 

です。また、式④より、$X_i$の分散は、

V[X_i] = E[X_i^2] - (E[X_i])^2 =\frac{1}{3} - \left(\frac{1}{3}\right)^2= \frac{2}{9}

です。さらに、式⑤より、$X_i$と$X_j$の共分散は、

Cov(X_i, X_j) = E[X_i X_j] - E[X_i]E[X_j] = \frac{1}{12} - \frac{1}{3} \cdot \frac{1}{3} = -\frac{1}{36}

です。

上記の式から、分散、共分散は確率変数の添え字に限らず一定のため、

V(X_1) + V(X_2) + V(X_3) + V(X_4) = 4 \cdot V(X_i)

および

\begin{align}
\text{Cov}(X_1, X_2) &+ \text{Cov}(X_1, X_3) + \text{Cov}(X_1, X_4) + \text{Cov}(X_2, X_3)   \\
 & + \text{Cov}(X_2, X_4) + \text{Cov}(X_3, X_4) = 6 \cdot \text{Cov}(X_i, X_j)
\end{align}

です。よって、$V(\bar{X})$は、

V(\bar{X}) =  \frac{1}{16} \left[ 4 \cdot V(X_i) +  6 \cdot \text{Cov}(X_i, X_j) \right]

となります。

よって、

V(\bar{X}) =\frac{1}{16} \left( 4 \cdot \frac{2}{9}  +2 \cdot 6 \cdot \left(-\frac{1}{36}\right)\right)= \frac{5}{144}

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?