事象と確率

統計学実践ワークブック

Last updated at 2024-05-22Posted at 2024-05-20

『統計学実践ワークブック』第１章の勉強メモです。

事象と確率

事象Aの確率を$P(A)$とあらわす。

空集合$\phi$は起きえない事象を表し、全集合$\Omega$は必ず起きる事象を表す。これらの確率は、$P(\phi)=0$、$P(\Omega)=1$である。AとBが排反($A\land B=\phi$)ならば、$P(A\lor B)=P(A)+P(B)$が成り立つ。特に、Aとその余事象は排反で$A\lor A^c=\Omega$であるので、$P(A^c)=1-P(A)$である。AとBが排反でない場合には、$P(A\lor B)=P(A)+P(B)-P(A\land B)$が成り立つ。これを包除原理という。

例１

どちらの番組も見なかった生徒の数は

\begin{multline}
\begin{split}
(\Omega )-(A\lor B)&=(\Omega)-\{(A)+(B)-(A\land B)\} \\
&=50-(20+15-5) \\
&=20
\end{split}
\end{multline}

条件付確率とベイズの定理

Aが起きたという条件の下でBが起きる条件付確率$P(A|B)$を以下で定義する。

P(A|B)=\frac{P(A\land B)}{P(A)}

また、分母を払うと、

P(A\land B)=P(A)\times P(B|A)

条件付確率においてAとBの順序を変えると$P(A\land B)=P(B)\times P(A|B)$とかける。$P(A)\times P(B|A)=P(B)\times P(A|B)$より、

\begin{multline}
\begin{split}
P(A|B)&=\frac{P(B|A)P(A)}{P(B)}\\
&=\frac{P(B|A)P(A)}{P(A\land B)+P(A^c \land B)}\\
&=\frac{P(B|A)P(A)}{P(B|A)P(A)+P(B|A^c)P(A^c)}
\end{split}
\end{multline}

とかける。これをベイズの定理という。

AからBへの因果的な順序がある場合に用いることが多く、$P(A)$を事前確率、$P(A|B)$を事後確率
という。結果が与えられたときに原因の確率を求めるような文脈でベイズの定理を用いる。

ベイズの定理は、全事象$\Omega$が排反な事象$A_1,\cdots,A_k$の和である場合

\Omega = A_1\lor \cdots \lor A_k , A_i\land A_j=\phi(i\ne j)

次の形に拡張される。

P(A_i|B)=\frac{P(B|A_i)P(A_i)}{\sum_{j=1}^k P(B|A_j)P(A_j)}

期待値と分散

さいころの目のようなランダムに変動する変数を確率変数とよぶ。

確率変数を$X$と大文字で表し、$X$のとりうる値を$x$と小文字で表す。$X$が値$x$を取る確率$P(X=x)$を

p(x)=P(X=x)

とあらわし、確率関数とよぶ。$X$の期待値$E[X]$は

/mu = E[X]=\sum_x x\cdot p(x)

で定義される。$X$の関数$g(X)$の期待値は

E[g(X)]=\sum_x g(x)\cdot p(x)

で定義される。$X$の分散は

\sigma^2=V[X]=E[(X-\mu)^2]=\sum_x (x-\mu)^2p(x)

で定義される。また、

\begin{multline}
\begin{split}
V[X]&=E[X^2-2X\mu +\mu^2]=E[X^2]-2\mu E[X]+\mu^2 \\
&=E[X^2] -\mu^2 \\
&=E[X^2]-E[x]^2
\end{split}
\end{multline}

が成り立つ。

連続的な確率変数のときは確率密度関数$f(x)$を

f(x)=\lim_{\epsilon \to\infty}\frac{P(x < X \leq x+\epsilon)}{\epsilon}

と定義して

\begin{multline}
\begin{split}
E[X]&=\int_{-\infty}^\infty xf(x)dx \\
V[X]&=\int_{-\infty}^\infty (x-\mu)^2f(x)dx
\end{split}
\end{multline}

のように和を積分に置き換えて定義すればよい。

問１．１

[1]

大学全体の合格率は

\begin{multline}
\begin{split}
(女子の合格率)\times(女子の比率)＋(男子の合格率)\times(男子の比率)&=0.5\times 0.4+0.4\times 0.6\\
&=0.44
\end{split}
\end{multline}

[2]

\begin{multline}
\begin{split}
P(女子|合格)&=\frac{P(合格|女子)P(女子)}{P(合格)} \\
&=\frac{0.5*0.4}{0.44}\\
&=\frac{5}{11}
\end{split}
\end{multline}

問１．２

[1]

\begin{multline}
\begin{split}
E[X]&=1*p(1)+2*p(2)+3*p(3)\\
&=1*p(1)+2*p(1)+3*\{1-2p(1)\}\\
&=3-3p(1)
\end{split}
\end{multline}

ここで、$p(1)$は$\frac{1}{6},\frac{1}{3},\frac{1}{2}$をとり、$E[X]>2$なので、$p(1)=\frac{1}{6}$となる。期待値は、

E[X]=3-3\cdot\frac{1}{6}=\frac{5}{2}

分散は、

\begin{multline}
\begin{split}
V[X]&=(1-\mu)^2p(1)+(2-\mu)^2p(2)+(3-\mu)^2p(3) \\
&=(1-\frac{5}{2})^2\frac{1}{6}+(2-\frac{5}{2})^2\frac{1}{6}+(3-\frac{5}{2})^2\frac{2}{3}\\
&=\frac{9}{24}+\frac{1}{24}+\frac{2}{12}\\
&=\frac{7}{12}
\end{split}
\end{multline}

[2]

２回投げた時の出る目を$X_1,X_2$とする。

\begin{multline}
\begin{split}
P(X_1\leq2,X_2\leq2)&=(X_1\leq2)\times (X_2\leq2)=\frac{1}{9}\\
P(X_1\leq3,X_2\leq3)&=(X_1\leq3)\times (X_2\leq3)=\frac{1}{4}\\
P(Y=3)&=P(X_1\leq3,X_2\leq3)-P(X_1\leq2,X_2\leq2)=\frac{5}{36}
\end{split}
\end{multline}

問１．３

[1]

\begin{multline}
\begin{split}
P(病気|検査１陽性)&=\frac{P(検査１陽性|病気)P(病気)}{P(検査１陽性)}\\
&=\frac{P(検査１陽性|病気)P(病気)}{P(検査１陽性|病気)P(病気)+P(検査１陽性|病気でない)P(病気でない)} \\
&=\frac{0.99*0.01}{0.99*0.01+0.02*0.99}\\
&=\frac{1}{3}
\end{split}
\end{multline}

[2]

問題文よりわかっている確率は

$P(検査１陽性|病気)=0.99$
$P(病気)=0.01$
$P(検査１陽性|病気でない)=0.02$
$P(病気|検査１陽性)=0.33\cdots$
$P(検査２陽性|病気 \land 検査１陽性)=0.9$
$P(検査２陽性|病気でない \land 検査１陽性)=0.1$

\begin{multline}
\begin{split}
P(病気|検査２陽性\land 検査１陽性)&=\frac{P(病気\land 検査２陽性\land 検査１陽性)}{P(検査２陽性\land 検査１陽性)}\\
&=\frac{P(検査２陽性|病気\land 検査１陽性)P(病気\land 検査１陽性)}{P(検査２陽性\land 検査１陽性)}\\
&=\frac{P(検査２陽性|病気\land 検査１陽性)P(検査１陽性|病気)P(病気)}{P(検査２陽性\land 検査１陽性)}\\
&=\frac{P(検査２陽性|病気\land 検査１陽性)P(検査１陽性|病気)P(病気)}{P(検査２陽性|検査１陽性)P(検査１陽性)}\\
&=\frac{P(検査２陽性|病気\land 検査１陽性)P(検査１陽性|病気)P(病気)}{P(検査２陽性|病気\land 検査１陽性)P(病気\land 検査１陽性)+P(検査２陽性|病気でない\land 検査１陽性)P(病気でない\land 検査１陽性)}\\
&=\frac{P(検査２陽性|病気\land 検査１陽性)P(検査１陽性|病気)P(病気)}{P(検査２陽性|病気\land 検査１陽性)P(検査１陽性|病気)P(病気)+P(検査２陽性|病気でない\land 検査１陽性)P(検査１陽性|病気でない)P(病気でない)}\\
&=\frac{0.9*0.99*0.01}{0.9*0.99*0.01+0.1*0.2*0.99}\\
&=\frac{9}{11}
\end{split}
\end{multline}

参照

『統計学実践ワークブック』

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up