Help us understand the problem. What is going on with this article?

ポアソン分布を和で条件付けすると二項分布となる

More than 3 years have passed since last update.

 数学 Advent Calendar 2016の11日目の記事です。
 前日(10日)夜に空きを見つけたので飛び入りで参加します!

 急ぎ足になってしまいますが早速……。

ポアソン分布を和で条件付けする

 ポアソン分布は平均λで決定される分布で、カウントデータをモデル化する際に登場します。確率質量関数は次の通り。

P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!} \tag{1}

 $X_1$と$X_2$が独立にそれぞれポアソン分布に従うとします。

X_1 \sim \text{Poisson}(\lambda_1) \\
X_2 \sim \text{Poisson}(\lambda_2)

 このとき、$X_1$と$X_2$の和もまたポアソン分布に従うこと(和に関する再生性)が知られています。

W = X_1 + X_2 \\
W \sim \text{Poisson}(\lambda_1 + \lambda_2)

 $X_1$と$X_2$は互いに独立としましたが、$X_1$と$W$や、$X_2$と$W$は独立にはならないので、$W$で条件付けしたときの分布がどうなるか考えてみます。
 言い換えれば、ポアソン分布に従う変数の和の値nが分かっているときの分布です。
 結論からいうと二項分布なのですが、これを数式で示します。

条件付き確率

 条件付き確率についておさらいしましょう。
 事象Bであるときの事象Aの確率を、$P(A \mid B)$と表します。高校数学の教科書に$P_B(A)$と書いていたやつです。後ろが条件付けにあたるのに注意してください。
 条件付き確率では以下の式が成り立ちます。このように定義しているというべきですが……。

P(A \cap B) = P(A \mid B)\,P(B) または P(A \mid B) = \frac{P(A \cap B)}{P(B)} \tag{2}

もとの話に戻る

 問題にしていたのは$W = n$のときの$X_1$の分布、つまり$P(X_1=k \mid W=n)$です。
 上記の関係式(2)より、

P(X_1=k \mid W=n) = \frac{P(X_1=k かつ W=n)}{P(W=n)} \tag{3}

 ここから右辺の分子を変形していきます。
 $W$は$X_1$と$X_2$の和なので、

P(X_1=k かつ W=n) = P(X_1=k かつ X_2=n-k)

 さらに、$X_1$と$X_2$は互いに独立なので、

P(X_1=k かつ X_2=n-k) = P(X_1=k)\,P(X_2=n-k)

 したがって式(3)は、

P(X_1=k \mid W=n) = \frac{P(X_1=k)\,P(X_2=n-k)}{P(W=n)} \tag{4}

のように表すことができました。

 ここまで来れば、あとは右辺の確率部分をポアソン分布の確率質量関数で置き換える単純作業です。
 ポアソン分布の確率質量関数(1)より、

P(X_1=k) = \frac{{\lambda_1}^k e^{-\lambda_1}}{k!} \\
P(X_2=n-k) = \frac{{\lambda_2}^{n-k} e^{-\lambda_2}}{(n-k)!} \\
P(W=n) = \frac{(\lambda_1 + \lambda_2)^n e^{-(\lambda_1 + \lambda_2)}}{n!} \\

 これらを式(4)に代入して整理します。

P(X_1=k \mid W=n) = \frac{n!}{k!\,(n-k)!}\frac{{\lambda_1}^k{\lambda_2}^{n-k}}{(\lambda_1 + \lambda_2)^n} \tag{5}

 指数関数が分子と分母で相殺されて綺麗に消えました。
 後ろの分数部分をもうちょっと変形していきます。

\frac{{\lambda_1}^k{\lambda_2}^{n-k}}{(\lambda_1 + \lambda_2)^n} = \frac{{\lambda_1}^k{\lambda_2}^{n-k}}{(\lambda_1 + \lambda_2)^k(\lambda_1 + \lambda_2)^{n-k}} = \left(\frac{\lambda_1}{\lambda_1 + \lambda_2}\right)^k\left(\frac{\lambda_2}{\lambda_1 + \lambda_2}\right)^{n-k}

 よって、

P(X_1=k \mid W=n) = {_n}\mathrm{C}_k\left(\frac{\lambda_1}{\lambda_1 + \lambda_2}\right)^k\left(\frac{\lambda_2}{\lambda_1 + \lambda_2}\right)^{n-k} \tag{6}

と、二項分布の確率質量関数になりました。$\frac{\lambda_2}{\lambda_1 + \lambda_2} = 1 - \frac{\lambda_1}{\lambda_1 + \lambda_2}$となるのがミソです。

 最後に結論!

X_1 \mid W=n \sim \text{Binomial}\left(n,\ p = \frac{\lambda_1}{\lambda_1 + \lambda_2}\right)

一般化

 以上の議論を多変量に一般化すると次のことがいえます。(証明は割愛します、、)

 $\{X_1, \ldots, X_m\}$が互いに独立なポアソン分布に従うとき、$W = \sum X_i$もポアソン分布に従う。$W$で条件付けした同時分布は多項分布で、その確率パラメータは、$\left\{p_i = \frac{\lambda_i}{\sum \lambda_i}\right\}$となる。

X_1, \ldots, X_m \mid W=n \sim \text{Multinomial}(n, p_1, \ldots, p_m) ただし p_i = \frac{\lambda_i}{\sum \lambda_i}

 もっと直観的には、次の二つの方法が実質同じという意味です!

  • ポアソン乱数で$\{X_1, \ldots, X_m\}$を生成し、合計がnになったものを抜き出す
  • あらかじめnを与えて多項乱数で$\{X_1, \ldots, X_m\}$を生成する
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Comments
No comments
Sign up for free and join this conversation.
If you already have a Qiita account
Why do not you register as a user and use Qiita more conveniently?
You need to log in to use this function. Qiita can be used more conveniently after logging in.
You seem to be reading articles frequently this month. Qiita can be used more conveniently after logging in.
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
ユーザーは見つかりませんでした