はじめに
この記事は統計検定2級合格への道 〜その③〜の続編です。
この記事は「改訂版 日本統計学会公式認定 統計検定2級対応 統計学基礎」を参考に、私が学んだ内容をまとめたものです。
確率
事象
1回ずつあるいは1個ずつの個別の結果が偶然に左右される実験や観測を試行といい、試行によって起こりうる個々の結果を根元事象または標本点、根元事象の集合を事象、全ての根元事象の集合を全事象または標本空間($\Omega$で表す)という。
- 和事象(和集合)
事象:$A_{1},A_{2},\cdots,A_{n}$のうち、少なくとも1つが起こるという事象
A_{1} \cup A_{2} \cup \cdots \cup A_{n}
- 積事象(積集合)
事象:$A_{1},A_{2},\cdots,A_{n}$が同時に起こるという事象
A_{1} \cap A_{2} \cap \cdots \cap A_{n}
- 空事象(空集合)
何も起こらないという事象。$\emptyset$で表す
- 余事象(補集合)
全事象の中で含まれていない根元事象からなる事象。$A^{c}$で表す
- 互いに排反(互いに素)
2つの事象の積事象が空事象である場合、これらの事象は互いに排反(互いに素)であるという
確率
事象の起こりやすさを確率といい、以下のように定義される。
P(A) = {事象Aに含まれる根元事象の数 \over 全事象の根元事象の数}
確率:$P(A)$は以下の確率の公理(コルモゴロフの公理)を満たす
- $0 \leq P(A) \leq 1$
- $P(\Omega) = 1 (\Omega:全事象)$
- $P(A_{1} \cup A_{2} \cup \cdots) = P(A_{1}) + P(A_{2}) + \cdots (A_{1},A_{2},\cdotsが互いに排反の場合)$
条件付き確率
ある事象:Aが起きるという条件下で、別の事象:Bが起こる確率を条件付き確率:$P(B|A)$といい、以下のように定義される。
P(B|A) = {P(A \cap B) \over P(A)}
ベイズの定理
ある事象:Aに対して、その事象の原因として排反な事象:$H_{1},H_{2},\cdots,H_{n}$が考えられ、それら以外の原因はないとする。
各事象の条件付確率は以下のように表される。
P(H_{i}|A) = {P(A \cap H_{i}) \over P(A)}
$P(A \cap H_{i})$は条件付き確率の式から、以下のように表される。
P(A \cap H_{i}) = P(H_{i}) \times P(A|H_{i})
これを用いて上の条件付き確率の式を変換する。
P(H_{i}|A) = {P(H_{i}) \times P(A|H_{i}) \over P(A)}
事象:Aの原因が$H_{1},H_{2},\cdots,H_{n}$以外になく、これらの事象が互いに排反である場合、その確率は以下のように変形できる。
P(A) = P(A \cap H_{1}) + P(A \cap H_{2}) + \cdots + P(A \cap H_{n}) = \sum_{j=1}^{n}P(H_{j})P(A|H_{j})
この式を用いて条件付き確率:$P(H_{i}|A)$を変形すると、ベイズの定理とよばれる以下の式が得られる。
P(H_{i}|A) = {P(H_{i})P(A|H_{i}) \over \sum_{j=1}^{n}P(H_{j})P(A|H_{j})}
ベイズの定理を用いることにより、事象:Aが発生する確率を用いずとも、$P(H_{i}|A)$を計算することができる。
確率変数と確率分布
変数:Xの取りうる値が$\{0,1,2,\cdots,9\}$であり、どの値も全て等しい確率で取り得る場合、確率は以下のように表すことができる。
P(X=i)={1 \over 10} (i=0,1,2,\cdots,9)
このように、変数:Xの値は分からないが、取り得る値の確率が与えられるとき、変数Xを確率変数という。
また、確率変数:Xの取り得る値とそれらの確率との対応関係を確率分布という。
離散型の確率変数:Xに対して、より一般的に確率を記述すると以下のようになる。
Xがx_{i}の値を取る確率 P(X=x_{i})=f(x_{i}) (i=0,1,2,\cdots)
$f(x_{i})$は確率関数とよばれ、確率の公理により以下の条件を満たす。
0 \leq f(x_{i}) \leq 1 \\
\sum^{\infty}_{i=1}f(x_{i})=1
連続型の確率変数;Xの場合、確率は以下のように表される。
Xがa以上、b以下の値を取る確率 P(a \leq X \leq b)=\int_{a}^{b}f(x){\rm d}x
$f(x)$は確率密度関数ととよばれる常に正の関数である。この関数も同様に確率の公理により、以下の式を満たす。
\int_{\infty}^{-\infty}f(x){\rm d}x = 1
確率変数:Xの、ある値までの確率の和を累積分布関数とよび、以下のように定義される。
F(x)=P(X \leq x)=\int_{-\infty}^{x}f(u){\rm d}u
連続型の確率変数の場合、累積分布関数の導関数は確率密度関数と等しくなる。
期待値と分散
確率変数:$X$の期待値は以下のように定義される。
\begin{align}
離散型の確率変数の期待値 E[X] &\equiv \sum_{i}x_{i}f(x_{i})=\mu \\
連続型の確率変数の期待値 E[X] &\equiv \int^{\infty}_{-\infty}xf(x){\rm d}x=\mu
\end{align}
期待値は分布の重心であり、母集団の平均(母平均)を表すものである。
Xが確率変数であるとき、その関数である$u(X)$も確率変数であり、期待値は以下のように定義することができる。
\begin{align}
E[u(X)] &= \sum_{i}u(x_{i})f(x_{i}) \\
E[u(X)] &= \int^{\infty}_{-\infty}u(x)f(x){\rm d}x
\end{align}
確率変数:Xの分散は、母平均:$\mu$からの偏差の2乗の期待値として以下のように定義される。
\begin{align}
離散型の確率変数の分散 V[X] &\equiv E[(X-\mu)^{2}]=\sum_{i}(x_{i}-\mu)^{2}f(x_{i})=\sigma^{2} \\
連続型の確率変数の分散 V[X] &\equiv E[(X-\mu)^{2}]=\int^{\infty}_{-\infty}(x-\mu)^{2}f(x){\rm d}x=\sigma^{2}
\end{align}
分散の平方根は標準偏差とよばれる。
モーメント
平均や分散を一般化した概念にモーメントがあり、以下のように定義される。
\begin{align}
k次のモーメント \mu_{k}^{'} &\equiv E[X^{k}] \\
k次の中心モーメント \mu_{k} &\equiv E[(X-\mu)^{k}]
\end{align}
この定義に則ると、平均は1次のモーメント、分散は2次の中心モーメントである。
1次と2次のモーメントは分布の中心の位置と散らばりの大きさという分布の主要な特徴を表すが、高次のモーメントはさらに詳しい特徴を表す。
3次の中心モーメントを測定単位に無関係になるように$\sigma^{3}$で割った値は非対称性の度合いを測る歪度とよばれる指標となり、平均を中心として確率分布が対称ならこの指標は0、右に長い裾を持つなら正、逆に左に長い裾を持つなら負の値を取る。
4次の中心モーメントを同様の意味で$\sigma^{4}$で割った値は平均付近の尖り具合および分布の裾の長さに関係する尖度とよばれる指標として用いられる。正規分布の尖度は3となることが知られており、正規分布を基準として、尖度が3よりも大きければ正規分布よりも裾が長い、3よりも小さければ裾が短いということを表している。
おわりに
μは平均(mean)の頭文字:mに対応するギリシャ文字であり、σは標準偏差(standard deviation)の頭文字:sに対応するギリシャ文字である。こういう豆知識を増やしていきたい。試験には絶対関係ないけど。
後、モーメントと言われると、物理を学んだ人間としては「回転」をイメージしてしまう。モーメントの計算、めっちゃめんどくさくて嫌やったなぁ。量子系に進んだから、院試以降で結局使わんかった。電磁気学の次に嫌い。