#はじめに
学校でも日常生活でもよく耳にする確率。
「そもそも確率ってなんなの?」
このページでは以下の3種類の確率の考え方についてまとめています。
-
数学的確率(古典的確率)
- 小中学校で習う確率。苦手だった人も多いはず。
-
統計的確率
- 数学的確率を少し拡張。自然と利用している事が多い気がする。
-
公理論的確率
- 現代数学における確率の考え方。統計学や人工知能の分野でよく用いられる。
数学的確率(古典的確率)
確率=\frac{求める場合の数}{起こりうる全ての場合の数}
小中学校で習う確率。
サイコロとかコインとかのあれ。
場合の数の比。
現代確率論と比較して古典的確率とも呼ばれる。
ピエール・シモン・ラプラス(Pierre-Simon Laplace)によって1814年にまとめられた。
直感的であり、確率に対する理解を深めるには良いが、適用できる状況というのは限られてくる。
この確率は、どの単一事象の起こる確率も同じであるという仮定の下に成り立っている。
《同様に確からしい(equally likely)》ってやつ。
サイコロはどの目も等しい確率で上を向くし、コインの表と裏のでる確率は等しい。
だからサイコロ1回振ったらそれぞれの目がでる確率は1/6だし、コインの表がでる確率は1/2。
適用できない例として、各事象が同様に確からしいとは限らない場合が挙げられる。
というか世の中ほとんど同様に確からしくない。
じゃんけんにおいて、それぞれの事象(「ぐー」「ちょき」「ぱー」)の起こる確率は等しいの?
結局サイコロもコインも同様に確からしい保証は無いと言ってしまえばそれまで。
この確率では、各事象の起こる確率は同様に確からしいと仮定することで、確率を計算する。
じゃんけんもそれぞれの起こる確率は同様に確からしいとすることで確率を計算することが可能となる。
適用できる範囲が狭いだけであって、間違っているわけではない。
後述する公理論的確率の特殊化とみなせる。
統計的確率
確率=\frac{事象の起こった回数}{試行回数}
発生頻度の比。
世間一般的に、確率といったらこれが割りと多い気がする。
プロ野球選手の打率とか、交通事故に遭遇する確率とかまさにこれ。
確率を頻度で定義する。
同様に確からしいという仮定を立てるのが困難な事象に対して、確率を計算できる。
じゃんけんで勝つ確率が知りたければ、ひったすらじゃんけんを繰り返し、勝った回数を数えることで求める。
実際に試行をする必要があり、数学的に扱うのが少しむずかしい。
公理論的確率
$Ω$を集合とし、$A$、$B$を$Ω$の部分集合、$Pr$を$Ω$の部分集合から実数への関数とする。
公理1
Pr(A) \geq 0
公理2
Pr(\Omega) = 1
公理3
A \cap B = \{\} ならば \\
Pr(A\cup B) = Pr(A)+Pr(B)
Prが全ての公理を満たすとき、
- 集合$Ω$を標本空間
- $Ω$の部分集合を事象
- 関数$Pr$を確率分布
- 実数$Pr(A)$を$A$が起きる確率
とする。
現代数学における確率の定義。
確率の公理を定め、その公理を満たすものを確率として定義する。
確率の公理は1933年、アンドレイ・ニコラエヴィッチ・コルモゴロフ(Andray Nikolaevich Kolmogorov)によって提唱された。
同様に確からしいという仮定を必要とせず、かつ数学的に確率を扱うことが可能。
これまでの定義と異なり、かなり抽象度の高い定義となっている。
そのため、多くの問題に適用が可能である。
起こりうる事象を網羅する標本空間と、対応する確率分布を考えることで確率を論じることができる。
古典的確率は、確率分布を一様分布とみなした場合の公理論的確率となる。
サイコロを例にしてみる。
サイコロを1回振る時の標本空間$Ω$は以下のようになる。
\Omega = \{1がでる, 2がでる, 3がでる, 4がでる, 5がでる, 6がでる\}
漏れもダブりもない。
続いて確率分布。
$ω$ | 1がでる | 2がでる | 3がでる | 4がでる | 5がでる | 6がでる | 計 |
---|---|---|---|---|---|---|---|
$Pr(ω)$ | $p_1$ | $p_2$ | $p_3$ | $p_4$ | $p_5$ | $p_6$ | 1 |
確率分布は上のように表で書くこともあれば
Pr(\omega_i)=p_i \qquad (i = 1,2,3,4,5,6)
のように数式で書く場合もある。
ここで一様な確率分布、すなわちどの単一事象の起こる確率も同じであるような確率分布を考えることで、数学的確率と同じ議論となる。この例の場合$p_i=1/6$である。
さらに、同様に確からしくないサイコロやコインに関しても、確率分布を考えれば議論ができる。
具体的に議論するためにはさらに、確率変数やら確率密度関数といった概念がここから展開されていく。
まとめ
- 数学的確率
- 統計的確率
- 公理論的確率