0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

ポアソン分布を理解する_統計検定2級対策

0
Posted at

以下の統計検定2級対策動画で用いられているスライドの一部です。

STEP 1 具体例から考えてみよう

あるパン屋では、平日の午前10時から11時の1時間に、平均で 4人 の顧客が来店します。

この時間帯に、顧客が ちょうど3人 だけ来店する確率はどれくらいでしょうか?


ポアソン分布の出番

このような 「ある一定の区間で発生する事象の回数」 を予測したいときに、 ポアソン分布 という考え方が非常に役立ちます。

  • お店に1時間で何人お客さんが来るか
  • Webサイトに1分間で何件アクセスがあるか
  • 1平方キロメートルあたりに生息する特定の動物の数

問題を数式に落とし込む

パン屋の例題を解くために、2つの重要な数値を確認します。

  • 単位区間あたりの平均回数 ($\lambda$)

    • この問題では平均 4人 の顧客が来店するので、$\lambda = 4$ となります。
  • 求めたい事象の回数 ($k$)

    • 3人 来店する確率を知りたいので、$k = 3$ となります。

確率を計算する魔法の式

この確率を計算するのが、ポアソン分布の 確率質量関数 です。

$$
P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}
$$

  • $P(X=k)$: 事象がちょうど $k$ 回起こる確率
  • $\lambda$: 事象が起こる平均回数
  • $k$: 求めたい事象の回数
  • $e$: ネイピア数 (約2.718)
  • $k!$: $k$ の階乗 ($k \times (k-1) \times \dots \times 1$)

実際に計算してみよう

先ほどのパン屋の例 ($\lambda=4, k=3$) を式に代入します。

$$
P(X=3) = \frac{4^3 e^{-4}}{3!}
$$

  1. 各項を計算

    • $4^3 = 4 \times 4 \times 4 = 64$
    • $3! = 3 \times 2 \times 1 = 6$
    • $e^{-4} \approx 0.0183$ (電卓やソフトウェアで計算)
  2. 確率を計算
    $$
    P(X=3) = \frac{64 \times 0.0183}{6} \approx 0.1952
    $$


結論:パン屋の来客確率

計算の結果、平日の午前10時から11時に顧客が ちょうど3人 来店する確率は、約 19.5% と分かりました。

image.png


グラフ生成コード (Python)

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import poisson

# Parameters for the Poisson distribution
lambda_param = 4
k_values = np.arange(0, 15)

# Calculate probabilities using scipy
probabilities = poisson.pmf(k_values, lambda_param)

# Create the plot
plt.figure(figsize=(10, 6))
bars = plt.bar(k_values, probabilities, color='skyblue', edgecolor='black')

# Highlight the bar for k=3
bars[3].set_color('salmon')
bars[3].set_edgecolor('red')

# Add labels and title
plt.title('Poisson Distribution (lambda = 4)', fontsize=16)
plt.xlabel('Number of Customers (k)', fontsize=12)
plt.ylabel('Probability P(X=k)', fontsize=12)
plt.xticks(k_values)
plt.grid(axis='y', linestyle='--', alpha=0.7)

# Add text for the highlighted probability
prob_k3 = probabilities[3]
plt.text(3, prob_k3 + 0.005, f'{prob_k3:.4f}', ha='center', color='red', weight='bold')

plt.show()

応用編 別の例題を見てみよう

ある工場で生産されるマイクロチップは、1つあたり 0.01% の確率で初期不良が発生します。

この工場から無作為に 20,000個 のチップを検査したとき、初期不良品が ちょうど3個 見つかる確率はどれくらいでしょうか?


課題:計算がとても大変

この問題は、本来 二項分布 で考えます。

  • 試行回数 $n = 20000$
  • 成功確率 $p = 0.0001$

しかし、$n$ が非常に大きく、$p$ が非常に小さいため、二項分布の直接計算は非常に複雑です。

ここでポアソン分布が再び活躍します。


ポアソン分布で近似計算する

試行回数 $n$ が大きく、成功確率 $p$ が小さい場合、二項分布はポアソン分布で非常によく近似できます。

  1. パラメータ $\lambda$ の計算
    $\lambda = np$ の関係式を使います。
    $$
    \lambda = 20000 \times 0.0001 = 2
    $$
    これは、平均して 2個 の不良品が見つかる、と解釈できます。

image.png


近似確率を計算する

$\lambda=2$, 求めたい回数 $k=3$ として、ポアソン分布の式で確率を計算します。

$$
P(X=3) = \frac{2^3 e^{-2}}{3!} = \frac{8 \times e^{-2}}{6}
$$

$e^{-2} \approx 0.1353$ なので、

$$
P(X=3) \approx \frac{8 \times 0.1353}{6} \approx 0.1804
$$

結論として、初期不良品がちょうど3個見つかる確率は、約 18.0% と近似計算できます。


ポアソン分布が使える3つの条件

ポアソン分布は万能ではなく、事象が以下の3つの条件を満たす場合に適用できます。

  • 希少性
    ごく短い区間では、事象は1回起こるか、全く起こらないかのどちらか。
  • 定常性
    事象の発生確率は、どの区間をとっても一定である。
  • 独立性
    ある区間での事象の発生が、他の区間での発生確率に影響しない。

STEP 2 一般化と定義

ここまでの内容を整理し、ポアソン分布を学術的に定義し直しましょう。


ポアソン分布とは?

ポアソン分布 とは、

「単位区間あたりで平均 $\lambda$ 回起こる事象が、実際に $k$ 回起こる確率」
を示す 離散型 の確率分布です。


確率質量関数

ある事象が起こる回数を確率変数 $X$ とすると、$X$ が特定の値 $k$ をとる確率 $P(X=k)$ は、以下の式で計算されます。

$$
P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!} \quad (k=0, 1, 2, \dots)
$$


期待値と分散

ポアソン分布には、非常に重要な特徴があります。
それは、 期待値 (平均)と 分散 (ばらつきの大きさ)が、どちらもパラメータ $\lambda$ と等しくなる点です。

  • 期待値: $E[X] = \lambda$
  • 分散: $V[X] = \lambda$

最初のパン屋の例では $\lambda=4$ だったので、顧客数の期待値も分散も 4 となります。


二項分布との関係

試行回数 $n$ が非常に大きく、成功確率 $p$ が非常に小さい 二項分布 は、ポアソン分布でよく近似できます。

このとき、ポアソン分布のパラメータ $\lambda$ は以下の関係式で求められます。

$$
\lambda = np
$$

image.png


まとめ

  • ポアソン分布

    • 単位区間あたりの平均発生回数 $\lambda$ が分かっているとき、実際の発生回数 $k$ の確率を求める分布。
  • 確率の計算式

    • $P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}$ を使う。
  • 重要な特性

    • 期待値と分散はどちらも $\lambda$ に等しい。
  • 応用

    • $n$ が大きく $p$ が小さい二項分布は、$\lambda = np$ のポアソン分布で近似できる。

実社会での活用例

ポアソン分布は、ビジネスや研究の様々な場面で活用される強力なツールです。

  • 品質管理 (製品の欠陥数)
  • 需要予測 (特定商品の1日の販売数)
  • 交通量分析 (交差点の1時間の通行量)
  • 生物学 (特定の領域内の生物の個体数)
0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?