tags: 緑本
ポアソン分布
1. ポアソン分布とは
二項分布で, nが大きくpが小さい時, ポアソン分布に従う.
2. ポアソン分布の確率の定義
ポアソン分布の確率は, 以下のように定義される.
$$
p(y | \lambda) = \frac{\lambda^{y}\exp(-\lambda)}{y!}
$$
平均が$\lambda$である時, 確率変数が$y$という値になる確率.
3. ポアソン小数の法則
$np → \lambda$となるように, $n → \infty$, $p → 0$となる極限においては, 以下が成り立つ.
$$
{}_n \mathrm{C} _y, p^y(1 - p)^{n - y} → \frac{\lambda^{y}\exp(-\lambda)}{y!}
$$
4. ポアソン分布の期待値と確率変数
ポアソン分布を, $Po(\lambda)$で表す.
確率変数$Y$がポアソン分布$Po(\lambda)$に従うならば, 期待値と分散は等しくなる.
$$
E(Y) = \lambda, V(Y) = \lambda\
(\lambda\fallingdotseq np, 1 - p \fallingdotseq 1 \Longrightarrow E(y) = np → \lambda, V(y) = np(1 - p) → \lambda)
$$
5. ポアソン分布を使う場合
主に, 以下のような場合ポアソン分布を使う.
- カウントデータである
- 平均と分散が概ね等しい
- 標本が大きく, 確率が小さい時
6. ポアソン分布の例
プロシア騎兵連隊において馬に蹴られて亡くなった兵士の数
$\lambda = 0.61, E(Y) = 0.61, V(Y) = 0.61, \sqrt{V(Y)} = 0.77$
死亡数 | 0 | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|---|
観測数 | 109 | 65 | 22 | 3 | 1 | 0 |
理論値 | 108.7 | 66.3 | 20.2 | 4.1 | 0.6 | 0.1 |
7. ポアソン分布の出力
7-1. ポアソン分布の確率の出力
ポアソン分布の確率の出力は, dpois(x, lambda = "")
を用いて行う. 6. での例を用いると, 以下のように出力できる.
y <- c(0, 1, 2, 3, 4, 5)
prob <- dpois(y, lambda = 0.61)
prob %>% round(digits = 2)
> prob %>% round(digits = 2)
[1] 0.54 0.33 0.10 0.02 0.00 0.00
7-2. ポアソン分布のグラフの出力
plot()
を用いて, グラフを出力させると, 以下のようになる.
y <- c(0, 1, 2, 3, 4, 5)
prob <- dpois(y, lambda = 0.61)
plot(y, prob, type="o")
8. 参考文献
・久保拓弥(2012)『データ解析のための統計モデリング入門』 岩波書店.
・東京大学教養学部統計学教室 (編集)(1991)『統計学入門 (基礎統計学Ⅰ)』 東京大学出版.