#ゼロから始めるデータサイエンス-6章
コードを書かないで8章くらいまで読み進めてみたのですが、一番とっつきやすそうな確率からベイズの定理について知ろうと思います。
記号とかはとにかくスルーして、公式を覚えてきます。
##確率とは
現実世界の事象の不確実さを定量化する方法の1つ
また、
確率において**「事象Aの発生する確率」をP(A)**として表せる
ようです。
####ちなみに、P(A)は、probabilityの略!AもBとかEになりますんで、気にしない!
それと、あとでもう一度Pが出てきますのでご注意ください!
##まずは問題を解いてみる。
###①組み合わせ(コンビネーション)から、確率を求める!
####問題1:【1組が52枚の普通のトランプがある。この中から2枚同時に引くとき,2枚ともダイアを引く確率はいくらか?】
まずはやってみる
P(A) = \frac{_{13}C _2} { _{52}C _2} = \frac{13 × 12 ÷ 2 × 1}{52 × 51 ÷ 2×1} = \frac{13×6}{26×51} = \frac{78}{1326} = \frac{1}{17}
確率は、17分の1のようです!
##解説
####1:コンビネーション(C)の公式
この公式を覚えることで、簡単に確率を表示できます。
_n C _r = \frac{nからr個掛ける}{rから1まで掛ける}
###例えば、上の問題の場合は
_{13}C _2 = \frac{13 × 12}{2 × 1} = 78
_{52}C _2 = \frac{52 × 51}{2 × 1} = 1326
####【nからr個掛ける】とは?
13 * 12ですが、これはr=2のため13-1を行っています。
52*51も同様に r=2のため、52-1を行っています。
###②順列から確率を求める
一旦飛ばします!
##確率の従属と独立
###①独立
事象EとFが独立であるなら、次の式で定義されます。l
P(E\cap F) = P(E)P(F)
P(E)とP(F)は積(かけざん!)なので、このように表せます!
P(E\cap F) = P(E)*P(F)
双方の確率が従属ではない(独立)である場合は、次の式が当てはまります。
###問題2:【1組が52枚の普通のトランプがある。この中から2枚同時に引くとき,2枚ともダイアを引き、そのカードを戻してもう1度2枚ダイアを引く確率は!】
###問題1を使っちゃえ!(E = 17分の1,F = 17分の1)
P(E\cap F) = \frac{1}{17}×\frac{1}{17} = \frac{1}{289}
289分の1という答えが出ました!
一度引いた二枚のカードを戻して、もう一度引いているので、17分の1という確率に変わりはありません!
###②従属
####練習3:しかし、一度引いたカードを戻さないで50枚あるのカードの中から11のダイアのうち2枚を引く確率はどうでしょうか。
もう一度計算し直します!
P(A) = \frac{_{11}C _2} { _{50}C _2} = \frac{11 × 10 ÷ 2 × 1}{51 × 50 ÷ 2×1} = \frac{11 × 5}{51 × 25} = \frac{55}{1225} = \frac{11}{245}
1度目の確率と、2度目の確率が異なることがわかると思います!
そのため、
P(E\cap F) = \frac{1}{17}×\frac{11}{245} = \frac{11}{4165}
となります!
1回目の条件により、2回目の確率に影響が出る場合、双方には依存関係があるので、関係として従属といえるようです。
##条件付き確率
まずは公式から!
P(B\mid A) = \frac{P(A \cap B)}{P(A)}
こう表現することも出来るようです!
P(B\mid A) = \frac{\mid A\cap B \mid}{\mid A \mid}
##条件付き確率とは結局何なのか。
条件付き確率(じょうけんつきかくりつ、英: conditional probability)は、ある事象 B が起こるという条件下での別の事象 A の確率のことをいう。
参照:【条件付き確率 - Wikipedia】
まあ、とにかく問題を解いてみよう!(あまり分かっていない)
####問題4:(平等な)サイコロを1つ振った。出目を見逃してしまったが,友人が出目は偶数だと教えてくれた。このとき出目が 4以上であった確率を求めよ。
条件整理
・A条件:出た目は偶数(2,4,6)
・B条件:4以上の数字は(4,5,6)のどれか
####順番に計算していきます
A条件:まず、偶数が出る確率は6個中の3つなので、2分の1です!
P(A) = \frac{3}{6} = \frac{1}{2}
B条件:4以上(4,5,6)のうち、偶数(4,6)が出るのは
P(A\cap B) = \frac{2}{6} = \frac{1}{3}
数式通り当てはめるので
P(B\mid A) = \frac{P(A \cap B)}{P(A)}
P(B\mid A) = \frac{\frac{1}{3}}{\frac{1}{2}} = \frac{2}{3}
3分の2という確率が出ました!
一定の条件下で、ある事象が起こる確率って感じかな?
だとすれば、大地震が起こった後に地震(余震)が起こる確率も、条件付き確率ですね。
##ベイズの定理
∩∪∩
まずは公式
P(A\mid B) = \frac{P(B\mid A)P(A)}{P(B)}
確率付き条件と比較してみます
P(B\mid A) = \frac{P(A \cap B)}{P(A)}
ベイズの定理の場合、P(A | B)の部分が逆になっています。
早速当てはめてみます!
####問題4:(平等な)サイコロを1つ振った。出目を見逃してしまったが、友人が出目は4以上であったと教えてくれた。このとき出目が偶数である確率を求めよ。
P(A)とP(A | B)は先程の計算で出ているので、P(B)のみ計算して、公式に当てはめます!
B条件:4以上(4,5,6)が出る確率は6分の3ですね。
P(B) = \frac{3}{6} = \frac{1}{2}
P(A\mid B) = \frac{\frac{2}{3} *\frac{1}{2}}{\frac{1}{2}} = \frac{\frac{1}{3}}{\frac{1}{2}} = \frac{2}{3}
つまり、**条件Bが起こったあとで条件Aが起こる確率と条件Aが起こったあとで条件Bが起こる確率は同じだよ!**っていうのがベイズの定理なんですね!
#最後に
次はpythonで確率を求める関数を書いてみたいと思います!
間違っているところ等あったらぜひ教えてくださいm(__)m
最後まで呼んでいただきありがとうございました!