記事の内容
数理統計学、確率論の初学者向けに記事です。
条件付き期待値の「繰り返し期待値の法則」について、どの確率変数の期待値なのかを明確にしながら、できるだけ分かりやすく解説します!!
初心者の皆さんが混乱しがちなポイントに注意するために、繰り返しますが、どの確率変数の期待値なのかをはっきりと明示します。
そして、イメージできるように具体例を示します。
この公式は、一見すると複雑に見えますが、「平均の平均は、全体の平均になる」という直感的なアイデアを表したものです。
公式:繰り返し期待値の法則
確率変数$X$と$Y$があるとき、$Y$の期待値 $E[Y]$ は以下の式で計算できます。
$$E[Y] = E_X \left[ E_{Y|X}[Y|X] \right]$$
この公式は繰り返し期待値の法則 (Law of Total Expectation) やアダムの法則 (Adam's Law) とも呼ばれます。
記号の解説
この式のキモは、期待値$E$の右下に、どの確率変数について平均を取るかを明記した点です。
-
$E_{Y|X}[Y|X]$ (内側の期待値)
- これは「$X$の値をある特定の値に固定したときの、$Y$の条件付き期待値」です。
- 例えば、$X$がサイコロの目なら、「$X=1$のときの$Y$の平均」「$X=2$のときの$Y$の平均」… のように、$X$の値によって結果が変わる関数になります。
- $E_{Y|X}$ は、「$X$を固定して、$Y$について平均を取りますよ」という意味です。
-
$E_X[\dots]$ (外側の期待値)
- これは「内側の期待値で得られた**$X$の関数を、今度は$X$の確率**で重み付けして平均する」ことを意味します。
- $E_X$ は、「(カッコの中身を)$X$について平均を取りますよ」という意味です。
つまり、この公式は複雑な$Y$の期待値を、
- 一旦$X$で条件を付けて簡単な期待値 $E[Y|X]$ を計算し、
-
その結果を$X$のばらつきを考慮して平均する、
という2段階の計算に分割してくれる便利な道具なのです。
具体例で理解する:全国の高校生の平均身長
この公式を、全国の高校生の平均身長を求める例で考えてみましょう。
- $Y$: 高校生の身長
- $X$: 高校生の学年 (1年生, 2年生, 3年生)
- 求めたいもの: $E[Y]$ (全国の高校生、全体の平均身長)
ステップ1:内側の期待値 $E_{Y|X}[Y|X]$ を求める
まず、学年ごとに平均身長を計算します。これは「学年($X$)」という条件でグループ分けして、その中での「身長($Y$)」の平均を取ることに相当します。
- $E[Y|X=1]$ = 1年生の平均身長 (例: 168cm)
- $E[Y|X=2]$ = 2年生の平均身長 (例: 170cm)
- $E[Y|X=3]$ = 3年生の平均身長 (例: 171cm)
この「学年ごとの平均身長のリスト」が $E_{Y|X}[Y|X]$ です。これはまだ最終的な答えではなく、「学年」という変数$X$に依存する関数になっています。
ステップ2:外側の期待値 $E_X[\dots]$ を求める
次に、ステップ1で求めた「学年ごとの平均身長」を、**各学年の人数の割合(確率)**で加重平均します。これが「$X$について平均を取る」ということです。
全国の高校生の学年別人数比が、1年生:35%, 2年生:33%, 3年生:32%だとしましょう。
すると、全体の平均身長 $E[Y]$ は、
$$E[Y] = E_X[E[Y|X]]$$$$= (1年生の平均身長) \times P(X=1) + (2年生の平均身長) \times P(X=2) + (3年生の平均身長) \times P(X=3)$$$$= (168 \text{cm}) \times 0.35 + (170 \text{cm}) \times 0.33 + (171 \text{cm}) \times 0.32$$
$$= 58.8 + 56.1 + 54.72 = 169.62 \text{cm}$$
このように、学年ごとの平均(内側の期待値)を、学年の分布(外側の期待値)で平均することで、全体の平均身長を求めることができました。
まとめ
条件付き期待値の公式は、
$$E[Y] = E_X \left[ E_{Y|X}[Y|X] \right]$$
と書き下すことができ、これは
- まず、条件$X$を固定して、$Y$の期待値($X$の関数になる)を求める。
- 次に、その結果を、$X$自身の確率分布で平均する。
となります。