More than 5 years have passed since last update.

二項分布とPoisson分布

Posted at 2016-09-19

二項分布

基本的な事は、前記事-β分布-をご参照ください。

二項分布(Binomial distribution)は、コイン投げの結果を表す確率分布でした。

μ: 1回の試行でコインの表が出る確率0≤μ≤1
N: 試行回数(自然数)
k: (N回の試行のうち)表が出た回数
として、kの確率分布は、

p(k|N,μ)={}_NC_kμ^k(1-μ)^{(N-k)}\equiv Bin(k|N,μ)

このkの期待値は、1回ごとの表確率μとその回数Nの積なので、

\mathbb{E}[Bin(k|N,μ)]=Nμ

無限の試行

試行回数Nを無限に吹っ飛ばします。

\begin{eqnarray}
\lim_{N \to \infty} Bin(k|N,μ)&=&\lim_{N \to \infty} {}_NC_kμ^k(1-μ)^{(N-k)} \\
\end{eqnarray}

を考えるわけですが、この無限回試行の結果表が出る回数の期待値をλと置きます。

\mathbb{E}\big[\lim_{N \to \infty} Bin(k|N,μ)\big]=\lim_{N \to \infty}Nμ=λ

さて、無限回数に吹っ飛ばす事を前提に、少し二項分布の式を書き直します。

\begin{eqnarray}
{}_NC_kμ^k(1-μ)^{(N-k)} &=&\frac{N!}{(N-k)!k!}μ^k(1-μ)^{(N-k)} \\
&=& \frac{N(N-1)...(N-k+1)}{k!} μ^k(1-μ)^{(N-k)} \\
&=& \big( N(N-1)...(N-k+1)μ^k \big)  \frac{1}{k!} (1-μ)^{(N-k)} \\
&=& \Big( \frac{N}{N} \frac{(N-1)}{N}...\frac{(N-k+1)}{N}(Nμ)^k \Big)  \frac{1}{k!} (1-μ)^{(N-k)} \\
&=& \Big(1-\frac{0}{N}\Big)\Big(1-\frac{1}{N}\Big)...\Big(1-\frac{k-1}{N} \Big) (Nμ)^k\frac{1}{k!} (1-μ)^{(N-k)} \\
\end{eqnarray}

積和部分は、Nを無限に飛ばすと1ですね。

\begin{eqnarray}
\lim_{N \to \infty} Bin(k|N,μ)
&=&\lim_{N \to \infty} \Big(1-\frac{0}{N}\Big)\Big(1-\frac{1}{N}\Big)...\Big(1-\frac{k-1}{N} \Big) (Nμ)^k\frac{1}{k!} (1-μ)^{(N-k)} \\
&=&\lim_{N \to \infty}  (Nμ)^k\frac{1}{k!} (1-μ)^{(N-k)} \\
&=&\frac{λ^k}{k!}\lim_{N \to \infty} (1-μ)^{(N-k)} \\
&=&\frac{λ^k}{k!}\lim_{N \to \infty} \frac{(1-μ)^N}{(1-μ)^k} \\

\end{eqnarray}

λの定義より、

μ=\frac{λ}{\lim_{N \to \infty}N}

すなわち、

\begin{eqnarray}
\lim_{N \to \infty} Bin(k|N,μ)
&=&\frac{λ^k}{k!}\lim_{N \to \infty} \frac{(1-μ)^N}{(1-μ)^k} \\
&=&\frac{λ^k}{k!}\lim_{N \to \infty} \frac{(1-\frac{λ}{N})^N}{(1-\frac{λ}{N})^k} \\
\end{eqnarray}

分母は1になりますね。
また、

e^x=\lim_{n \to \infty}\Big(1+\frac{x}{n}\Big)^n

より、

\begin{eqnarray}
\lim_{N \to \infty} Bin(k|N,μ)
&=&\frac{λ^k}{k!}\lim_{N \to \infty} \Big(1-\frac{λ}{N}\Big)^N\\
&=&\frac{λ^k}{k!}e^{-λ} \equiv Po(k|λ)
\end{eqnarray}

これをポアソン分布(Poisson distribution)と呼びます。

Poisson分布とは

これなんぞ、というと、無限回投げた時にλ回の表が出るコインをhoge回投げた時に出る表の回数kの確率分布、ですよね。

で、コインの性質を支配するμの性質はどうなってるかというと、
無限回投げてもたったλ回しか表が出ないコインでして、

μ=\frac{λ}{\lim_{N \to \infty}N}

ですので、ま、ハッキリ言えばμすなわち「1回の試行で表が出る確率」がチョー小さいコインについて考えている、という事です。

ん？？

問題は、「コインをhoge回投げた時に出る表の回数kの確率分布」のhogeってなんぞ、という事です。

これは、特定の期待値を達成する所与のNに対して、hoge回という意味です。

ポアソン分布とは、「一定の(空間and/or時間)間隔で発生するイベント」を想定していて、その中で「稀に生じる離散的事象」の発生回数の確率分布です、という事。

「稀に生じる」というのがミソで、その稀さ加減：λ=Nμ=1になる「単位N=hoge」が分かっていれば、2N回の試行では「λ=2*hoge」のポアソン分布に従う、と言っているわけです。

例えば100回に1回表が出る事が期待されるコイン(μ=0.01)を、1000回投げた時に表が出る回数kの分布は、

p(k|N,μ)=Bin(k|1000,0.01)={}_{1000}C_k(0.01)^k(0.99)^{(1-k)}

ですが、μを十分小さいとみなすと、

p(k|λ=Nμ)=Po(k|0.01*1000)=Po(k|λ=10)=\frac{10^k}{k!}e^{-10}

と表現できるという事です。

こちらの方が計算上有利な時があるので、そんな時はポアソン分布を使ってあげましょう。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up