15
9

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

【初心者向け】ベイズの定理とは?

Posted at

AIや機械学習の勉強をしていると、「ベイズ推定」という言葉をよく見かけます。これを理解するためには「ベイズの定理」を理解すべきなのかと考えまして、「ベイズの定理」についてまとめました。

何かの実験で「結果」が観測されたとき、その背景にある「原因」の確率を求めたいときに、「ベイズの定理」が使われます。一般的に、原因 → 結果となる確率は求めやすいけど、結果 → 原因となる確率は見出しづらいのですが、こういうときに使われるんですね。

ベイズの定理

事前確率と事後確率は違うもの?

10枚のカードから1枚をひく実験を考えます。
10枚には赤と青の二種類のカードがあり、それらのうち何枚かには「当」マークが書かれています。次の図のような感じを考えましょう。

image.png

問1-1: このとき、「当」が出る確率は?

以降の数式で関数Pは確率を表します。

P(当) = \frac{3}{10}

問1-2: では、「赤」かつ「当」の確率は?

P(赤, 当) = \frac{2}{10}

このような「赤」と「当」が同時に生起する確率を__同時確率__と呼んでいます。

問1-3: 引いたカードが「赤」だったとき、「当」の確率は?

既に「赤」であることまでは分かっているので、問1-1や問1-2とは異なります。

P(当|赤) = \frac{2}{4}

問1-1のように「赤」であることが分かる前の確率を__事前確率__、問1-3のように「赤」であることが分かった後の確率を__事後確率__と呼びます。「|」を使っていて、問1-2とも式の書き方が違いますよね。__条件付き確率__ともいわれ、P(当|赤)と書かれていたら「赤」という条件が与えられたときに「当」である確率と読むことができます。「|」の後に書かれるのが条件です。

ベイズ統計における確率とは、確信度のこと! 

確率の考え方には、2種類あるそうです。先のカードの例における確率は、__主観確率__という考え方を理解すると、受け入れやすいです。

客観確率(一般的に考えられる確率)

確率を相対頻度の極限として捉える立場を__頻度主義__と読んでいて、この考え方における確率を__客観確率__と呼んでいます。
例えば、サイコロの目が1である確率は無限回試行すれば1/6ですよね。

主観確率(ベイズ統計学における確率)

確信度(degree of belief)をもとにした確率です。先のカードの例でいえば、当初は「当」が出る確率P(当)は30%だと思っていたのですが、カードが「赤」であると分かった瞬間に確率P(当|赤)は50%だと思うようになりました。新しい事実が発見されれば、確信度は異なるのですね。このようなベイズ統計学における確率は__主観確率__と呼ばれ、確率をこのように解釈する立場を__ベイズ主義__と呼びます。

ベイズの定理

さて、ベイズの定理の勉強していて、最初につまづくのは次の式だと思います。この式で重要なのは__結果から原因の確率(逆確率)を求められる__ことにあります。
ある原因が起きた時にある結果が起きる確率P(結果|原因)から、ある結果が観測されたときに、それがある原因によるものである確率P(原因|結果)が分かるという式になっています。__結果は観測しやすいけどその原因が分からない__ような場合に、ベイズの定理が威力を発揮します。__確率P(原因|結果)が確率P(結果|原因)から導かれる式__になっていることを確認しましょう。(私のような初心者は)式の導出はさておいて、こういう式が成り立つのだと受け入れることにしました。

P(原因|結果) = \frac{P(結果,原因)}{P(結果)}\\
             = \frac{P(結果|原因)}{P(結果)}・P(原因)\\
             = \frac{P(結果|原因)}{\sum_{原因} P(原因)P(結果|原因)}・P(S)

Sを原因、Xを結果として、もっと数式らしくなります。

P(S|X) = \frac{P(X,S)}{P(X)}\\
             = \frac{P(X|S)}{P(X)}・P(S)\\
             = \frac{P(X|S)}{\sum_{S} P(S)P(X|S)}・P(S)

結果から原因を探る問題は一般的に__逆問題__と呼ばれていて、これが求められる個所は世の中で多いため、これだけベイズの定理が求められているんですね。

参考資料

主に、次の書籍を参考に勉強しました。

続・わかりやすい パターン認識 -教師なし学習入門-
https://shop.ohmsha.co.jp/shopdetail/000000000574/

 第1章 ベイズ統計学
  1・2 ベイズの定理
  1・3 頻度から確信度へ
  1・4 逆確率 - 結果から原因を -

15
9
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
15
9

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?