More than 1 year has passed since last update.

ベルヌーイ試行と2項分布：成功確率のばらつきと中心極限定理の理解

Posted at 2024-07-27

概要

今回の記事では、ベルヌーイ試行、2項分布、中心極限定理について説明し、試行回数が増えると成功確率の分布がどのように正規分布に近づくかを実例とグラフで示します。

セクション1: ベルヌーイ試行と2項分布の基本

ベルヌーイ試行とは、成功（1）または失敗（0）の二項結果を持つ試行です。例えば、コイン投げで表が出るか裏が出るかの試行がこれに該当します。

2項分布は、n回の独立したベルヌーイ試行の成功回数の分布を表します。具体的には、以下のような確率質量関数（PMF）を持ちます：

$$
P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}
$$

ここで、

$( X )$ は成功回数の確率変数
$( k )$ は成功の具体的な回数
$ \binom{n}{k} $ は二項係数（n回中k回の成功の組み合わせ数）
$( p )$ は各試行での成功確率
$ (1-p) $ は失敗確率

セクション2: 中心極限定理

中心極限定理は、以下のように述べられる強力な数学の定理です：

「独立で同じ分布に従うランダム変数の和（または平均）は、その個々の変数の分布形状に関係なく、試行回数が増えるにつれて正規分布に近づく。」

この定理は、ベルヌーイ試行のような離散的な分布にも適用されます。

セクション3: 2項分布の正規分布近似

ベルヌーイ試行は成功（1）か失敗（0）のいずれかの結果を持つ試行です。n回の独立したベルヌーイ試行の成功回数( X )は2項分布 ( \text{Binomial}(n, p) ) に従います。

中心極限定理により、試行回数nが十分に大きい場合、2項分布 $( \text{Binomial}(n, p) )$ は平均が$( np )$、分散が$( np(1-p) )$ の正規分布に近似できます。具体的には、次のように表現されます：

$$
X \sim \text{Binomial}(n, p) \approx \mathcal{N}(np, np(1-p))
$$

セクション4: 試行回数と成功確率のばらつき

試行回数を増やすと以下のことが起こります：

期待値に近づく:
- 成功回数の期待値は $( np )$ です。試行回数が増えると、実際の成功回数が期待値$ ( np ) $に近づく確率が高くなります。
分散の減少:
- 2項分布の分散は $( np(1-p) ) $です。試行回数が増えると、成功回数の分布が平均値 $( np )$ の周りで狭くなります（標準偏差が$ ( \sqrt{np(1-p)} ) $のため）。

セクション5: 実例とグラフ

以下のコードは、PythonでPlotlyを使用して、試行回数が少ない場合と多い場合の2項分布をプロットし、それぞれ正規分布と比較する例です。

import plotly.graph_objects as go
import numpy as np
from scipy.stats import binom, norm

# パラメータ
p = 0.5  # 成功確率
n_small = 5  # 小さい試行回数
n_large = 100  # 大きい試行回数

# 小さい試行回数の2項分布
x_small = np.arange(0, n_small + 1)
y_small = binom.pmf(x_small, n_small, p)

# 大きい試行回数の2項分布
x_large = np.arange(0, n_large + 1)
y_large = binom.pmf(x_large, n_large, p)

# 正規分布の近似
mu_large = n_large * p
sigma_large = np.sqrt(n_large * p * (1 - p))
x_norm_large = np.linspace(0, n_large, 1000)
y_norm_large = norm.pdf(x_norm_large, mu_large, sigma_large)

# プロット小さい試行回数
fig_small = go.Figure()
fig_small.add_trace(go.Bar(x=x_small, y=y_small, name=f'Binomial (n={n_small})'))

fig_small.update_layout(
    title='Binomial Distribution (n=5)',
    xaxis_title='Number of Successes',
    yaxis_title='Probability'
)

# プロット大きい試行回数
fig_large = go.Figure()
fig_large.add_trace(go.Bar(x=x_large, y=y_large, name=f'Binomial (n={n_large})', opacity=0.6))


fig_large.update_layout(
    title='Binomial Distribution (n=100)',
    xaxis_title='Number of Successes',
    yaxis_title='Probability',
    barmode='overlay'
)

fig_small.show()
fig_large.show()

グラフについて

小さい試行回数（n=５）:
- 2項分布の棒グラフのみを表示。
- 試行回数が少ないため、分布は非対称で正規分布にはならない。
大きい試行回数（n=100）:
- 2項分布の棒グラフと正規分布の線グラフを重ねて表示。
- 試行回数が多くなると、2項分布が正規分布に近づく様子が視覚的に確認できる。

まとめ

試行回数を増やすことで成功回数のばらつきが減少し、予測しやすくなります。ベルヌーイ試行や2項分布の理解が深まると、さまざまな確率問題に応用できるでしょう。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up