ベイズの定理を利用した統計学では事前確率という考え方を仮定して計算をおこないます。このようにあいまいな人の主観をもとにした確率を扱うので、このような確率を主観確率と言うこともあります。
頻度主義とベイズ主義
学年全体から 5 名の生徒を選び、そのテストの点数を調べます。
頻度主義
- 学年全体のテストの成績に対して唯一無二の「平均得点」を想定する。
- 唯一無二の平均得点を持つ母集団からたまたまサンプルが得られたものと考える。
- たまたま選び出した 5 人の平均がサンプルとして与えられている。
このような考え方では、 5 人のサンプルはいつでも繰り返し何度も得られることを想定しています。このため、これを「頻度主義」と言います。
ベイズ主義
- 唯一無二の「平均得点」は追求しない。
- そのかわり平均得点の確率分布を調べる。
- いま手元に得られたサンプルを唯一のデータとして扱う。
- これらから「平均得点」の確率分布を計算し、統計情報として扱う。
従来の統計 (頻度主義) がデータを確率変数として扱うのに対し、ベイズ主義では母数を確率変数としてその確率分布を調べるところが異なります。
20 世紀の統計の世界においてはフィッシャーやネイマンといった先人によって「厳密ではない」とされベイズ主義は冬の時代を迎えました。しかし今日においては情報、金融、医療、心理学、人工知能などさまざまな分野でベイズ統計が応用されています。
いままで古典的な統計を主に追って来ましたが、最近流行の機械学習などを手に付けるにあたりベイズ統計学の考え方を避けて通ることはできないと思われます。
ベイズのパラドックス
以前にモンティ・ホール問題を紹介しましたが、ベイズ統計のからむクイズやパラドックスは他にもあります。
狼であることが疑われている村人が三人います。
狼は二人います。
この村の占い師は二人を殺害 (吊るす) 予定です。
※ 誰を処刑するかは占い師が決定します。
※ この占い師が人間であることはすでに確定しています。
村人 A は今夜吊るされる予定なのは誰か占い師にたずねました。
占い師は村人 B であると回答しました。
質問する前は村人 A B C のうち
誰が助かるのかわかりませんでしたから
助かる確率は 1/3 でした。
質問の解答を得たあと
村人 A はこれで残り処刑されるのは村人 C または自分なので
助かる確率が 1/2 になったと喜びました。
はたしてこの村人 A の計算は正しいでしょうか?
事前確率
三人の村人のうち二人は処刑され一人は助かります。このことから
P(A) = P(B) = P(C) = \frac 1 3
となります。
事後確率
もし A が助かるなら、占い師は村人 B または C が殺される確率を半々で言うわけです。
P(S_b|A) = P(S_c|A) = \frac 1 2
また二人処刑され、占い師はうそをつかないので
P(S_b|B) = 0 \\
P(S_b|C) = 1
求める確率は P(A|Sn) ですのでこれをベイズの定理にあてはめますと
\frac {1/2 × 1/3 (= A の生存率)} {1/2 × 1/3 + 0 × 1/3 (= B の生存率) + 1 × 1/3 (= C の生存率)} = \frac 1 3
となりますから 1/3 のままです。
ここで重要なのはモンティ・ホール問題では主体的に選択肢を選び直すことができた点です。この問題では村人が処刑される人を変える権利がない前提になっていますので、確率も 1/3 のまま変わりません。
まとめ
頻度主義とベイズ主義のちがい、またベイズ的な考え方の計算例について説明しました。