以下の統計検定2級対策動画で用いられているスライドの一部です。
STEP 1 具体例から考えてみよう
あるパン屋では、平日の午前10時から11時の1時間に、平均で 4人 の顧客が来店します。
この時間帯に、顧客が ちょうど3人 だけ来店する確率はどれくらいでしょうか?
ポアソン分布の出番
このような 「ある一定の区間で発生する事象の回数」 を予測したいときに、 ポアソン分布 という考え方が非常に役立ちます。
- お店に1時間で何人お客さんが来るか
- Webサイトに1分間で何件アクセスがあるか
- 1平方キロメートルあたりに生息する特定の動物の数
問題を数式に落とし込む
パン屋の例題を解くために、2つの重要な数値を確認します。
-
単位区間あたりの平均回数 ($\lambda$)
- この問題では平均 4人 の顧客が来店するので、$\lambda = 4$ となります。
-
求めたい事象の回数 ($k$)
- 3人 来店する確率を知りたいので、$k = 3$ となります。
確率を計算する魔法の式
この確率を計算するのが、ポアソン分布の 確率質量関数 です。
$$
P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}
$$
- $P(X=k)$: 事象がちょうど $k$ 回起こる確率
- $\lambda$: 事象が起こる平均回数
- $k$: 求めたい事象の回数
- $e$: ネイピア数 (約2.718)
- $k!$: $k$ の階乗 ($k \times (k-1) \times \dots \times 1$)
実際に計算してみよう
先ほどのパン屋の例 ($\lambda=4, k=3$) を式に代入します。
$$
P(X=3) = \frac{4^3 e^{-4}}{3!}
$$
-
各項を計算
- $4^3 = 4 \times 4 \times 4 = 64$
- $3! = 3 \times 2 \times 1 = 6$
- $e^{-4} \approx 0.0183$ (電卓やソフトウェアで計算)
-
確率を計算
$$
P(X=3) = \frac{64 \times 0.0183}{6} \approx 0.1952
$$
結論:パン屋の来客確率
計算の結果、平日の午前10時から11時に顧客が ちょうど3人 来店する確率は、約 19.5% と分かりました。
グラフ生成コード (Python)
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import poisson
# Parameters for the Poisson distribution
lambda_param = 4
k_values = np.arange(0, 15)
# Calculate probabilities using scipy
probabilities = poisson.pmf(k_values, lambda_param)
# Create the plot
plt.figure(figsize=(10, 6))
bars = plt.bar(k_values, probabilities, color='skyblue', edgecolor='black')
# Highlight the bar for k=3
bars[3].set_color('salmon')
bars[3].set_edgecolor('red')
# Add labels and title
plt.title('Poisson Distribution (lambda = 4)', fontsize=16)
plt.xlabel('Number of Customers (k)', fontsize=12)
plt.ylabel('Probability P(X=k)', fontsize=12)
plt.xticks(k_values)
plt.grid(axis='y', linestyle='--', alpha=0.7)
# Add text for the highlighted probability
prob_k3 = probabilities[3]
plt.text(3, prob_k3 + 0.005, f'{prob_k3:.4f}', ha='center', color='red', weight='bold')
plt.show()
応用編 別の例題を見てみよう
ある工場で生産されるマイクロチップは、1つあたり 0.01% の確率で初期不良が発生します。
この工場から無作為に 20,000個 のチップを検査したとき、初期不良品が ちょうど3個 見つかる確率はどれくらいでしょうか?
課題:計算がとても大変
この問題は、本来 二項分布 で考えます。
- 試行回数 $n = 20000$
- 成功確率 $p = 0.0001$
しかし、$n$ が非常に大きく、$p$ が非常に小さいため、二項分布の直接計算は非常に複雑です。
ここでポアソン分布が再び活躍します。
ポアソン分布で近似計算する
試行回数 $n$ が大きく、成功確率 $p$ が小さい場合、二項分布はポアソン分布で非常によく近似できます。
-
パラメータ $\lambda$ の計算
$\lambda = np$ の関係式を使います。
$$
\lambda = 20000 \times 0.0001 = 2
$$
これは、平均して 2個 の不良品が見つかる、と解釈できます。
近似確率を計算する
$\lambda=2$, 求めたい回数 $k=3$ として、ポアソン分布の式で確率を計算します。
$$
P(X=3) = \frac{2^3 e^{-2}}{3!} = \frac{8 \times e^{-2}}{6}
$$
$e^{-2} \approx 0.1353$ なので、
$$
P(X=3) \approx \frac{8 \times 0.1353}{6} \approx 0.1804
$$
結論として、初期不良品がちょうど3個見つかる確率は、約 18.0% と近似計算できます。
ポアソン分布が使える3つの条件
ポアソン分布は万能ではなく、事象が以下の3つの条件を満たす場合に適用できます。
-
希少性
ごく短い区間では、事象は1回起こるか、全く起こらないかのどちらか。 -
定常性
事象の発生確率は、どの区間をとっても一定である。 -
独立性
ある区間での事象の発生が、他の区間での発生確率に影響しない。
STEP 2 一般化と定義
ここまでの内容を整理し、ポアソン分布を学術的に定義し直しましょう。
ポアソン分布とは?
ポアソン分布 とは、
「単位区間あたりで平均 $\lambda$ 回起こる事象が、実際に $k$ 回起こる確率」
を示す 離散型 の確率分布です。
確率質量関数
ある事象が起こる回数を確率変数 $X$ とすると、$X$ が特定の値 $k$ をとる確率 $P(X=k)$ は、以下の式で計算されます。
$$
P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!} \quad (k=0, 1, 2, \dots)
$$
期待値と分散
ポアソン分布には、非常に重要な特徴があります。
それは、 期待値 (平均)と 分散 (ばらつきの大きさ)が、どちらもパラメータ $\lambda$ と等しくなる点です。
- 期待値: $E[X] = \lambda$
- 分散: $V[X] = \lambda$
最初のパン屋の例では $\lambda=4$ だったので、顧客数の期待値も分散も 4 となります。
二項分布との関係
試行回数 $n$ が非常に大きく、成功確率 $p$ が非常に小さい 二項分布 は、ポアソン分布でよく近似できます。
このとき、ポアソン分布のパラメータ $\lambda$ は以下の関係式で求められます。
$$
\lambda = np
$$
まとめ
-
ポアソン分布
- 単位区間あたりの平均発生回数 $\lambda$ が分かっているとき、実際の発生回数 $k$ の確率を求める分布。
-
確率の計算式
- $P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}$ を使う。
-
重要な特性
- 期待値と分散はどちらも $\lambda$ に等しい。
-
応用
- $n$ が大きく $p$ が小さい二項分布は、$\lambda = np$ のポアソン分布で近似できる。
実社会での活用例
ポアソン分布は、ビジネスや研究の様々な場面で活用される強力なツールです。
- 品質管理 (製品の欠陥数)
- 需要予測 (特定商品の1日の販売数)
- 交通量分析 (交差点の1時間の通行量)
- 生物学 (特定の領域内の生物の個体数)


