以下の統計検定2級®︎対策動画で用いられているスライドの一部です。
統計検定®2級対策オリジナル問題であり、非公式です。
※統計検定®は一般財団法人統計質保証推進協会の登録商標です。
問題
あるパン屋では、1営業日(8時間)で作られるクロワッサンのうち、規格外品となるものの数は24個であった。1時間あたりの規格外品の発生件数は、独立に同一のパラメータ$\lambda$のポアソン分布に従うものとする。ただし、パラメータ$\lambda$のポアソン分布の確率関数は $f(x) = \frac{\lambda^x e^{-\lambda}}{x!}$ ($x=0,1,2,...$) で与えられる。
[1] 1時間あたりの規格外品発生件数の標準偏差の推定値として、次の①~⑤のうちから最も適切なものを一つ選べ。
① 3 ② $\sqrt{3}$ ③ 9 ④ $24/8$ ⑤ $\sqrt{24/8^2}$
問題
[2] 平均の推定値 $\hat{\lambda}$ を用いて、このパン屋において1時間に規格外品が2個以上発生する確率を求めるといくらか。次の①~⑤のうちから最も適切なものを一つ選べ。なお、$e^{3} \doteqdot 20.09$ とする。
① 0.20
② 0.42
③ 0.58
④ 0.80
⑤ 0.95
解答
- [1] ② $\sqrt{3}$
- [2] ④ 0.80
この問題のポイント
この問題は、統計学で非常に重要な ポアソン分布 の基本的な性質と、その応用について理解しているかを問うています。
1. ポアソン分布とは?
「ある一定の期間や範囲において、ある事象が平均して何回起こるか($\lambda$回)がわかっているとき、その事象が実際に $k$ 回起こる確率」をモデル化する離散確率分布です。
-
身近な例
- 1時間にあるウェブサイトに来るアクセスの数
- ある交差点で1日に起こる交通事故の件数
- 1リットルの水に含まれるバクテリアの数
-
事象の特徴
- ランダムに 発生する
- 互いに 独立に 発生する
- (ごく短い期間や狭い範囲では) めったに起こらない(稀な事象)
2. なぜポアソン分布が重要なのか?
ポアソン分布は、「カウントデータ」を分析する際の基本的なモデルとなります。
-
実社会での活用例
- 品質管理: 製品の欠陥数を予測する
- 保険: 事故の発生件数を予測し、保険料を算出する
- 都市計画: 交通量を分析する
このように、 ランダムな発生事象を数学的に扱うための強力なツール であるため、統計学において非常に重要です。
3. 確率変数とその分布
この問題では、確率変数を $X$ と置きます。
-
確率変数 $X$:
- 1時間あたりの規格外品発生件数
-
確率分布:
- $X$ はパラメータ $\lambda$ を持つポアソン分布に従う
$$
X \sim \text{Po}(\lambda)
$$
4. ポアソン分布の重要な性質:平均と分散
ポアソン分布を特徴づける最も重要な性質の一つが、 平均(期待値)と分散が等しく、どちらもパラメータ $\lambda$ になる ことです。
-
平均:
- $E[X] = \lambda$
-
分散:
- $V[X] = \lambda$
-
標準偏差:
- $\sigma = \sqrt{V[X]} = \sqrt{\lambda}$
この性質は非常にシンプルで覚えやすく、問題を解く上で鍵となります。
5. ポアソン分布の確率計算
ある事象がちょうど $k$ 回起こる確率は、
以下の確率質量関数で計算されます。
$$
P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}
$$
- $\lambda$: 事象の平均発生回数
- $k$: 注目している事象の発生回数(0, 1, 2, ...)
- $e$: ネイピア数(約2.718)
- $k!$: $k$ の階乗(例: $3! = 3 \times 2 \times 1 = 6$, $0! = 1$)
「$k$ 回以上」や「$k$ 回未満」の確率は、
余事象の確率 を利用すると効率的に計算できます。
問題
[1] あるパン屋では、1営業日(8時間)で作られるクロワッサンのうち、規格外品となるものの数は24個であった。1時間あたりの規格外品発生件数の標準偏差の推定値として、最も適切なものを一つ選べ。
解答の根拠 [1]
1. 平均 $\lambda$ の推定
まず、1時間あたりの平均発生件数 $\lambda$ をデータから推定します。これを $\hat{\lambda}$ と書きます。
$$
\hat{\lambda} = \frac{\text{総発生件数}}{\text{総時間}} = \frac{24 \text{個}}{8 \text{時間}} = 3 \text{個/時間}
$$
2. 分散の推定
ポアソン分布では「 平均 = 分散 」です。したがって、分散の推定値 $\hat{V}(X)$ は平均の推定値 $\hat{\lambda}$ と等しくなります。
$$
\hat{V}(X) = \hat{\lambda} = 3
$$
解答の根拠 [1]
3. 標準偏差の推定
標準偏差は分散の正の平方根です。
$$
\text{標準偏差の推定値} = \sqrt{\hat{V}(X)} = \sqrt{3}
$$
したがって、正解は ② $\sqrt{3}$ となります。
問題
[2] 平均の推定値 $\hat{\lambda}$ を用いて、このパン屋において1時間に規格外品が2個以上発生する確率を求めるといくらか。なお、$e^{3} \doteqdot 20.09$ とする。
解答の根拠 [2]
1. 求める確率の定式化
確率変数 $X$(1時間の規格外品発生件数)が2以上になる確率 $P(X \ge 2)$ を求めます。
直接計算 ($P(X=2) + P(X=3) + \dots$) は困難なため、 余事象 を利用します。「2個以上発生する」の余事象は「2個未満(0個または1個)発生する」です。
$$
P(X \ge 2) = 1 - P(X < 2)
$$
$$
= 1 - \left( P(X=0) + P(X=1) \right)
$$
解答の根拠 [2]
2. 各確率の計算
[1]で求めた平均の推定値 $\hat{\lambda}=3$ をポアソン分布の確率関数に代入します。
-
$k=0$ の場合(1個も発生しない確率)
$$
P(X=0) = \frac{3^0 e^{-3}}{0!} = \frac{1 \cdot e^{-3}}{1} = e^{-3}
$$ -
$k=1$ の場合(ちょうど1個発生する確率)
$$
P(X=1) = \frac{3^1 e^{-3}}{1!} = \frac{3 \cdot e^{-3}}{1} = 3e^{-3}
$$
解答の根拠 [2]
3. 最終計算
これらの確率を足し合わせて、1から引きます。
$$
P(X \ge 2) = 1 - (e^{-3} + 3e^{-3}) = 1 - 4e^{-3}
$$
ここで、問題文の近似値 $e^3 \doteqdot 20.09$ を使います ($e^{-3} = 1/e^3$)。
$$
P(X \ge 2) \doteqdot 1 - 4 \times \frac{1}{20.09} = 1 - \frac{4}{20.09}
$$
$$
\approx 1 - 0.1991 \approx 0.8009
$$
計算結果に最も近い選択肢は ④ 0.80 です。
