0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【統計検定®︎2級対策】ポアソン分布オリジナル問題演習

Posted at

以下の統計検定2級®︎対策動画で用いられているスライドの一部です。

統計検定®2級対策オリジナル問題であり、非公式です。
※統計検定®は一般財団法人統計質保証推進協会の登録商標です。


問題

あるパン屋では、1営業日(8時間)で作られるクロワッサンのうち、規格外品となるものの数は24個であった。1時間あたりの規格外品の発生件数は、独立に同一のパラメータ$\lambda$のポアソン分布に従うものとする。ただし、パラメータ$\lambda$のポアソン分布の確率関数は $f(x) = \frac{\lambda^x e^{-\lambda}}{x!}$ ($x=0,1,2,...$) で与えられる。

[1] 1時間あたりの規格外品発生件数の標準偏差の推定値として、次の①~⑤のうちから最も適切なものを一つ選べ。

① 3 ② $\sqrt{3}$ ③ 9 ④ $24/8$ ⑤ $\sqrt{24/8^2}$


問題

[2] 平均の推定値 $\hat{\lambda}$ を用いて、このパン屋において1時間に規格外品が2個以上発生する確率を求めるといくらか。次の①~⑤のうちから最も適切なものを一つ選べ。なお、$e^{3} \doteqdot 20.09$ とする。

① 0.20
② 0.42
③ 0.58
④ 0.80
⑤ 0.95


解答

  • [1] ② $\sqrt{3}$
  • [2] ④ 0.80

この問題のポイント

この問題は、統計学で非常に重要な ポアソン分布 の基本的な性質と、その応用について理解しているかを問うています。


1. ポアソン分布とは?

「ある一定の期間や範囲において、ある事象が平均して何回起こるか($\lambda$回)がわかっているとき、その事象が実際に $k$ 回起こる確率」をモデル化する離散確率分布です。

  • 身近な例

    • 1時間にあるウェブサイトに来るアクセスの数
    • ある交差点で1日に起こる交通事故の件数
    • 1リットルの水に含まれるバクテリアの数
  • 事象の特徴

    • ランダムに 発生する
    • 互いに 独立に 発生する
    • (ごく短い期間や狭い範囲では) めったに起こらない(稀な事象)

2. なぜポアソン分布が重要なのか?

ポアソン分布は、「カウントデータ」を分析する際の基本的なモデルとなります。

  • 実社会での活用例
    • 品質管理: 製品の欠陥数を予測する
    • 保険: 事故の発生件数を予測し、保険料を算出する
    • 都市計画: 交通量を分析する

このように、 ランダムな発生事象を数学的に扱うための強力なツール であるため、統計学において非常に重要です。


3. 確率変数とその分布

この問題では、確率変数を $X$ と置きます。

  • 確率変数 $X$:

    • 1時間あたりの規格外品発生件数
  • 確率分布:

    • $X$ はパラメータ $\lambda$ を持つポアソン分布に従う

$$
X \sim \text{Po}(\lambda)
$$


4. ポアソン分布の重要な性質:平均と分散

ポアソン分布を特徴づける最も重要な性質の一つが、 平均(期待値)と分散が等しく、どちらもパラメータ $\lambda$ になる ことです。

  • 平均:
    • $E[X] = \lambda$
  • 分散:
    • $V[X] = \lambda$
  • 標準偏差:
    • $\sigma = \sqrt{V[X]} = \sqrt{\lambda}$

この性質は非常にシンプルで覚えやすく、問題を解く上で鍵となります。


5. ポアソン分布の確率計算

ある事象がちょうど $k$ 回起こる確率は、
以下の確率質量関数で計算されます。

$$
P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}
$$

  • $\lambda$: 事象の平均発生回数
  • $k$: 注目している事象の発生回数(0, 1, 2, ...)
  • $e$: ネイピア数(約2.718)
  • $k!$: $k$ の階乗(例: $3! = 3 \times 2 \times 1 = 6$, $0! = 1$)

「$k$ 回以上」や「$k$ 回未満」の確率は、
余事象の確率 を利用すると効率的に計算できます。

image.png


問題

[1] あるパン屋では、1営業日(8時間)で作られるクロワッサンのうち、規格外品となるものの数は24個であった。1時間あたりの規格外品発生件数の標準偏差の推定値として、最も適切なものを一つ選べ。


解答の根拠 [1]

1. 平均 $\lambda$ の推定

まず、1時間あたりの平均発生件数 $\lambda$ をデータから推定します。これを $\hat{\lambda}$ と書きます。

$$
\hat{\lambda} = \frac{\text{総発生件数}}{\text{総時間}} = \frac{24 \text{個}}{8 \text{時間}} = 3 \text{個/時間}
$$

2. 分散の推定

ポアソン分布では「 平均 = 分散 」です。したがって、分散の推定値 $\hat{V}(X)$ は平均の推定値 $\hat{\lambda}$ と等しくなります。

$$
\hat{V}(X) = \hat{\lambda} = 3
$$


解答の根拠 [1]

3. 標準偏差の推定

標準偏差は分散の正の平方根です。

$$
\text{標準偏差の推定値} = \sqrt{\hat{V}(X)} = \sqrt{3}
$$

したがって、正解は ② $\sqrt{3}$ となります。


問題

[2] 平均の推定値 $\hat{\lambda}$ を用いて、このパン屋において1時間に規格外品が2個以上発生する確率を求めるといくらか。なお、$e^{3} \doteqdot 20.09$ とする。


解答の根拠 [2]

1. 求める確率の定式化

確率変数 $X$(1時間の規格外品発生件数)が2以上になる確率 $P(X \ge 2)$ を求めます。

直接計算 ($P(X=2) + P(X=3) + \dots$) は困難なため、 余事象 を利用します。「2個以上発生する」の余事象は「2個未満(0個または1個)発生する」です。

$$
P(X \ge 2) = 1 - P(X < 2)
$$

$$
= 1 - \left( P(X=0) + P(X=1) \right)
$$


解答の根拠 [2]

2. 各確率の計算

[1]で求めた平均の推定値 $\hat{\lambda}=3$ をポアソン分布の確率関数に代入します。

  • $k=0$ の場合(1個も発生しない確率)
    $$
    P(X=0) = \frac{3^0 e^{-3}}{0!} = \frac{1 \cdot e^{-3}}{1} = e^{-3}
    $$

  • $k=1$ の場合(ちょうど1個発生する確率)
    $$
    P(X=1) = \frac{3^1 e^{-3}}{1!} = \frac{3 \cdot e^{-3}}{1} = 3e^{-3}
    $$


解答の根拠 [2]

3. 最終計算

これらの確率を足し合わせて、1から引きます。

$$
P(X \ge 2) = 1 - (e^{-3} + 3e^{-3}) = 1 - 4e^{-3}
$$

ここで、問題文の近似値 $e^3 \doteqdot 20.09$ を使います ($e^{-3} = 1/e^3$)。

$$
P(X \ge 2) \doteqdot 1 - 4 \times \frac{1}{20.09} = 1 - \frac{4}{20.09}
$$

$$
\approx 1 - 0.1991 \approx 0.8009
$$

計算結果に最も近い選択肢は ④ 0.80 です。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?