6
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

【JDLA E資格】確率分布

Last updated at Posted at 2021-03-02

#はじめに
JDLA E資格試験で出題される確率分布について解説した記事です。
E資格試験の応用数学パートでは、確率分布の定義式が問われることに加えて、最尤法などに発展させて出題されます
また、確率分布は機械学習・深層学習全般において使用されるため、本稿の内容を理解しておくのは必須です。

なお、他パートの具体的な解説については、下記をご覧ください。

[E資格試験に関する私の投稿記事リスト][link-1]
[link-1]:https://qiita.com/fridericusgauss/items/5a97f2645cdcefe15ce0

###目次

  1. 確率分布
  2. 連続型確率分布
  3. 離散型確率分布
  4. おわりに

###数学表記
$\mathbb{R}$は実数集合です。
確率の諸定義については、下記をご覧ください。
[期待値・分散][link-2]
[link-2]:https://qiita.com/fridericusgauss/items/ab36d7cf91093d284ba0

#確率分布
確率分布とは、ある標本空間$\Omega$をとる確率変数$X$に対して、それぞれの値をとる確率$P(X)$を対応させた関数のことです。
連続型確率変数の場合、その確率分布を__確率密度関数__、離散型確率変数の場合、その確率分布を__確率質量関数__と呼びます。

#連続型確率分布
###確率密度関数の定義
連続型確率変数$X$は標本空間$\Omega \subseteq \mathbb{R}$をとることとします。
その確率密度関数は式(1)を満たす$f_{X}(x)$です。
また、$f_{X}(x)$は式(2)を満たします。

\begin{align}
&\int_{A}f_{X}(x)\,dx=P(X\in A), A \subseteq \Omega
\tag{1}\\
&\int_{\Omega}f_{X}(x)\,dx=1
\tag{2}
\end{align}

ただし、$A$は$\Omega$に含まれるある区間を指します。

###連続型確率分布の例
E資格で出題される連続型確率分布は、正規分布(ガウス分布)です。
正規分布の確率密度関数$f_{X}(x)$は式(3)で表されます。

f_{X}(x; \mu ,\sigma^2)=\frac{1}{\sqrt {2\pi \sigma^2}}\exp{\biggl (}-{\frac {(x-\mu)^2}{2\sigma^{2} }}{\biggr )}
\tag{3}

ただし、$\mu$は平均パラメータで、$\sigma^2$は分散パラメータです。

正規分布に従う$X$の期待値は$\mathbb{E}[X]=\mu$、分散は$\mathbb{V}[X]=\sigma^2$です。

#離散型確率分布
###確率質量関数の定義
離散型確率変数$X$は標本空間$\Omega=\{x_1,x_2,\cdots,x_k\}$($x_i\in \mathbb{R}$)をとることとします。
その確率質量関数$f_{X}(x)$は式(4)を表され、式(5)を満たします。

\begin{align}
&f_{X}(x_i)=P(X=x_i), x_i \in \Omega
\tag{4}\\
&\sum_{i=1}^{k}f_{X}(x_i)=1
\tag{5}
\end{align}

###離散型確率分布の例
E資格で出題される離散型確率分布は、ベルヌーイ分布__と__マルチヌーイ分布カテゴリカル分布)です。

####ベルヌーイ分布
標本空間$\Omega=\{x_1,x_2\}$のように、事象が2種類である試行(2値の結果が得られる試行)を__ベルヌーイ試行__と呼びます。
_ベルヌーイ分布__は確率変数$X$がベルヌーイ試行に従うときの確率分布です。
ベルヌーイ分布の確率質量関数$f
{X}(x)$は式(6)で表されます。

f_{X}(x; p)=p^{x}(1-p)^{1-x}
\tag{6}

ただし、標本空間$\Omega=\{0,1\}$、$p$は確率パラメータであり、式(7)の関係で与えられます。

\left\{
\begin{array}{ll}
f_{X}(0)=1-p \\
f_{X}(1)=p
\end{array}
\right.
\tag{7}

ベルヌーイ分布に従う$X$の期待値は$\mathbb{E}[X]=p$、分散は$\mathbb{V}[X]=p(1-p)$です。
なお、この導出は割愛しますが、下記の期待値と分散の定義に当てはめると導出できます。
[期待値・分散][link-2]

####マルチヌーイ分布
標本空間$\Omega=\{x_1,x_2,\cdots,x_k\}$のように、事象が$k$種類である試行(多値の結果が得られる試行)を__マルチヌーイ試行__と、便宜上呼ぶことにします。
マルチヌーイ分布カテゴリカル分布)は確率変数$X$がマルチヌーイ試行に従うときの確率分布です。
マルチヌーイ分布の確率質量関数$f_{X}(\boldsymbol{x})$は式(8)で表されます。

f_{X}(\boldsymbol{x}; \boldsymbol{p})=\prod_{j
=1}^{k} p_{j}^{x_j}
\tag{8}

ただし、$\boldsymbol{x}=(x_1,x_2,\cdots,x_k)^{\mathrm{T}}$はone-hotベクトルです。
one-hotベクトルとは、一つだけの要素が$1$、それ以外の要素は$0$であるベクトルなので、式(9)を満たします。

\sum_{j=1}^{k}x_j=1, x_j\in \left\{0,1 \right\}
\tag{9}

また、$\boldsymbol{p}=(p_1,p_2,\cdots,p_k)^{\mathrm{T}}$は確率パラメータであり、式(10)の関係で与えられます。

\left\{
\begin{array}{ll}
f_{X}(x_j)=p_j \\
\sum_{j=1}^{k}p_j=1, p_j\in [0,1]
\end{array}
\right.
\tag{10}

マルチヌーイ分布において、$k=2$とすると、ベルヌーイ分布に一致します。

マルチヌーイ分布に従う$X$の期待値は$\mathbb{E}[X=x_j]=p_j$、分散は$\mathbb{V}[X=x_j]=p_j(1-p_j)$です。
なお、この導出は割愛しますが、下記の期待値と分散の定義に当てはめると導出できます。
[期待値・分散][link-2]

#おわりに
E資格向けの確率分布について解説しました。
なお、上記は、2021年2月時点における内容であることにご注意ください。

[E資格試験に関する私の投稿記事リスト][link-1]

6
4
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?