概要
確率変数を扱う際には、離散型か連続型かによって確率の表現方法が異なります。
-
確率質量関数(Probability Mass Function; PMF)
離散型確率変数に対して、各値が取られる確率を表す関数。
例:サイコロ、コイン投げ、二項分布など。 -
確率密度関数(Probability Density Function; PDF)
連続型確率変数に対して、ある範囲に値が入る確率を面積として表す関数。
例:正規分布、指数分布、t分布など。
数式
確率質量関数(PMF)
離散型確率変数 $X$ の場合:
$$
P(X = x) = p(x)
$$
$$
\quad \sum_x p(x) = 1
$$
確率密度関数(PDF)
連続型確率変数 $X$ の場合:
$$
P(a \leq X \leq b) = \int_a^b f(x) , dx
$$
$$
\quad \int_{-\infty}^{\infty} f(x) , dx = 1
$$
数式の説明
-
PMF の性質
- すべての確率は 0 以上。
- 全ての値の確率の和が 1 になる。
- 典型的に「数えられる事象」を表現。
-
PDF の性質
- 値そのものの確率 $P(X=x)$ は 0。
- 区間に対する積分が確率を与える。
- 曲線下の面積が 1 になる。
具体例
確率質量関数(離散型)
-
サイコロ:
$$
P(X = k) = \frac{1}{6}, \quad k = 1,2,3,4,5,6
$$ -
二項分布(コイン投げを n 回繰り返す):
$$
P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}
$$
確率密度関数(連続型)
-
正規分布 $N(\mu, \sigma^2)$:
$$
f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp \left( -\frac{(x-\mu)^2}{2\sigma^2} \right)
$$ -
指数分布(待ち時間など):
$$
f(x) = \lambda e^{-\lambda x}, \quad x \geq 0
$$
使用される場面(分布と典型例)
分類 | 分布名 | 使用される場面の例 |
---|---|---|
離散型(PMF) | 一様分布 | サイコロやくじ引き(等確率) |
二項分布 | コイン投げの成功回数、試行の成功/失敗 | |
多項分布 | カテゴリ分け(例:サイコロの出目の回数分布) | |
ポアソン分布 | 一定時間内の事故件数、問い合わせ件数 | |
幾何分布 | 初めて成功するまでの試行回数 | |
超幾何分布 | カードゲームや抽選(母集団から無作為抽出) | |
連続型(PDF) | 連続一様分布 | 区間内で等確率に発生する現象(例:乱数生成) |
正規分布 | 身長・テストの点数・測定誤差 | |
指数分布 | 機械の故障までの時間、待ち時間 | |
t分布 | 母分散未知の平均推定、信頼区間 | |
F分布 | 分散分析(ANOVA)、分散比の検定 | |
カイ二乗分布 | 適合度検定、独立性の検定 |
関連する数式
-
期待値(離散型)
$$
E[X] = \sum_x x , p(x)
$$ -
期待値(連続型)
$$
E[X] = \int_{-\infty}^{\infty} x f(x) , dx
$$ -
分散
$$
\mathrm{Var}(X) = E\big[(X - E[X])^2\big]
$$