数学 Advent Calendar 2016の11日目の記事です。
前日(10日)夜に空きを見つけたので飛び入りで参加します!
急ぎ足になってしまいますが早速……。
ポアソン分布を和で条件付けする
ポアソン分布は平均λで決定される分布で、カウントデータをモデル化する際に登場します。確率質量関数は次の通り。
P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!} \tag{1}
$X_1$と$X_2$が独立にそれぞれポアソン分布に従うとします。
X_1 \sim \text{Poisson}(\lambda_1) \\
X_2 \sim \text{Poisson}(\lambda_2)
このとき、$X_1$と$X_2$の和もまたポアソン分布に従うこと(和に関する再生性)が知られています。
W = X_1 + X_2 \\
W \sim \text{Poisson}(\lambda_1 + \lambda_2)
$X_1$と$X_2$は互いに独立としましたが、$X_1$と$W$や、$X_2$と$W$は独立にはならないので、$W$で条件付けしたときの分布がどうなるか考えてみます。
言い換えれば、ポアソン分布に従う変数の和の値nが分かっているときの分布です。
結論からいうと二項分布なのですが、これを数式で示します。
条件付き確率
条件付き確率についておさらいしましょう。
事象Bであるときの事象Aの確率を、$P(A \mid B)$と表します。高校数学の教科書に$P_B(A)$と書いていたやつです。後ろが条件付けにあたるのに注意してください。
条件付き確率では以下の式が成り立ちます。このように定義しているというべきですが……。
P(A \cap B) = P(A \mid B)\,P(B) または P(A \mid B) = \frac{P(A \cap B)}{P(B)} \tag{2}
もとの話に戻る
問題にしていたのは$W = n$のときの$X_1$の分布、つまり$P(X_1=k \mid W=n)$です。
上記の関係式(2)より、
P(X_1=k \mid W=n) = \frac{P(X_1=k かつ W=n)}{P(W=n)} \tag{3}
ここから右辺の分子を変形していきます。
$W$は$X_1$と$X_2$の和なので、
P(X_1=k かつ W=n) = P(X_1=k かつ X_2=n-k)
さらに、$X_1$と$X_2$は互いに独立なので、
P(X_1=k かつ X_2=n-k) = P(X_1=k)\,P(X_2=n-k)
したがって式(3)は、
P(X_1=k \mid W=n) = \frac{P(X_1=k)\,P(X_2=n-k)}{P(W=n)} \tag{4}
のように表すことができました。
ここまで来れば、あとは右辺の確率部分をポアソン分布の確率質量関数で置き換える単純作業です。
ポアソン分布の確率質量関数(1)より、
P(X_1=k) = \frac{{\lambda_1}^k e^{-\lambda_1}}{k!} \\
P(X_2=n-k) = \frac{{\lambda_2}^{n-k} e^{-\lambda_2}}{(n-k)!} \\
P(W=n) = \frac{(\lambda_1 + \lambda_2)^n e^{-(\lambda_1 + \lambda_2)}}{n!} \\
これらを式(4)に代入して整理します。
P(X_1=k \mid W=n) = \frac{n!}{k!\,(n-k)!}\frac{{\lambda_1}^k{\lambda_2}^{n-k}}{(\lambda_1 + \lambda_2)^n} \tag{5}
指数関数が分子と分母で相殺されて綺麗に消えました。
後ろの分数部分をもうちょっと変形していきます。
\frac{{\lambda_1}^k{\lambda_2}^{n-k}}{(\lambda_1 + \lambda_2)^n} = \frac{{\lambda_1}^k{\lambda_2}^{n-k}}{(\lambda_1 + \lambda_2)^k(\lambda_1 + \lambda_2)^{n-k}} = \left(\frac{\lambda_1}{\lambda_1 + \lambda_2}\right)^k\left(\frac{\lambda_2}{\lambda_1 + \lambda_2}\right)^{n-k}
よって、
P(X_1=k \mid W=n) = {_n}\mathrm{C}_k\left(\frac{\lambda_1}{\lambda_1 + \lambda_2}\right)^k\left(\frac{\lambda_2}{\lambda_1 + \lambda_2}\right)^{n-k} \tag{6}
と、二項分布の確率質量関数になりました。$\frac{\lambda_2}{\lambda_1 + \lambda_2} = 1 - \frac{\lambda_1}{\lambda_1 + \lambda_2}$となるのがミソです。
最後に結論!
X_1 \mid W=n \sim \text{Binomial}\left(n,\ p = \frac{\lambda_1}{\lambda_1 + \lambda_2}\right)
一般化
以上の議論を多変量に一般化すると次のことがいえます。(証明は割愛します、、)
$\{X_1, \ldots, X_m\}$が互いに独立なポアソン分布に従うとき、$W = \sum X_i$もポアソン分布に従う。$W$で条件付けした同時分布は多項分布で、その確率パラメータは、$\left\{p_i = \frac{\lambda_i}{\sum \lambda_i}\right\}$となる。
X_1, \ldots, X_m \mid W=n \sim \text{Multinomial}(n, p_1, \ldots, p_m) ただし p_i = \frac{\lambda_i}{\sum \lambda_i}
もっと直観的には、次の二つの方法が実質同じという意味です!
- ポアソン乱数で$\{X_1, \ldots, X_m\}$を生成し、合計がnになったものを抜き出す
- あらかじめnを与えて多項乱数で$\{X_1, \ldots, X_m\}$を生成する