Zennで私が記事にしていた内容の転写です。
はじめに
この記事は統計検定2級の取得を目指す方向けに構成されています。
問題の趣旨
3変数の確率変数の期待値と分散と相関係数に関する問題です。2ひねりから3ひねりくらいしていて、かつ2016年以前にこのような問題は出ていないので難しく感じます。
ですが、やっていることは基本の組み合わせです。
前提
標準化された$Xi (i=1,2,3)$とそれらの平均$Y$です。ここから
$$
E(Xi) = 0, V(Xi) = 1
$$
が成り立ちます。
問は、X1, Yの相関係数を求めます。2変数の相関係数$ρ$は
$$
ρ=\frac{cov(X1,Y)}{\sqrt{V(X1)V(Y)}}
$$
ここまではたいていの人はたどり着きます。
解説
V(Y)の値を求めます。
$$
V(Y)=V(\frac{X1+X2+X3}{3})
$$
分散の性質
$$
V(kx) = k^2V(x), k=定数
$$
より、
$$
V(Y)=\frac{1}{9}V(X1+X2+X3)
$$
$$
V(Y)=\frac{1}{9}(V(X1)+V(X2)+V(X3)+2cov(X1,X2)+2cov(X2,X3)+2cov(X3,X1))
$$
標準化されていて、かつ$X1,X2,X3$は無相関なので、
$$
2cov(X1,X2)+2cov(X2,X3)+2cov(X3,X1) = 0
$$
かつ標準化されているのですべての確率変数は1なので
$$
V(Y)=\frac{1}{9}*(1+1+1) = \frac{1}{3}
$$
次にcov(X1,Y)を考えます。公式より、
$$
cov(X1,Y)=E[(X1-μ_{1})(Y-μ_{Y})]
$$
標準化されているので、平均μはゼロですね。したがって
$$
cov(X1,Y)=E(X1Y)
$$
$$
E(X1Y)=E(X1)*E(Y)
$$
$$
E(Y)=E(\frac{X1+X2+X3}{3}) = \frac{1}{3}(E(X1)+E(X2)+E(X3))
$$
以上から$E(X1Y)$は整理すると
$$
\frac{1}{3}(E(X1^2)+E(X1X2)+E(X1X3))
$$
ここで、
$$
E(X1)*E(X1) \neq (E(X1))^2
$$
ですので注意です。
$$
E(X1)*E(X1) = E(X1^2)
$$
こちらが正解です。
ここまできて$E(X1^2)$ってどうやって計算するんだ?となった方が多いかと思われます。ここで使うのが、
$$
V(x) = E(x^2) - (E(x))^2
$$
この公式です。合格するだけなら、$E(x^2)$がきたらこの公式を用紙に書いておけばいいと思います。
前提より、$E(X1)=0$ですので、$(E(X1))^2$もゼロです。したがって
$$
V(X1) = E(X1^2)
$$
$E(X1X2)$や$E(X1X3)$は前提からゼロですね。これらををまとめると右辺は$V(X1)$しか残らないので、$cov(X1,Y)$は、
$$
cov(X1,Y)=\frac{1}{3}
$$
これで相関係数を計算する各パーツがそろいました。それぞれ数値を当てはめると、
$$
ρ=\frac{cov(X1,Y)}{\sqrt{V(X1)V(Y)}}=\frac{\frac{1}{3}}{\sqrt{\frac{1}{3}}}=\sqrt{\frac{1}{3}}=0.577...
$$
こちらが答えとなります。