参考文献
- 結城 浩『数学ガールの秘密ノート/やさしい統計』 SBクリエイティブ、2016年。
代表値
最大値、最小値、平均 $μ$、最頻値、中央値
(pp.86-87)
偏差の2乗平均を分散 $V$ ("Variance") という
(p.109)
《分散 $V$》=《[$n$ 個の数値の]2乗の平均》-《平均の2乗》
(p.121)
標準偏差 $σ$
分散の平方根のうち、負でないほう
すなわち、分散を $V$ とし、標準偏差 $σ$ とすると
$$ σ = \sqrt{V}$$
である。
(p.138)
正規分布のグラフを平均 $μ$ から、標準偏差 $σ$ ごとに区切ると、
おおよそ $34%, 14%, 2%$ という割合が現れる。
(p.151)
平均 $μ$ は期待値 $μ$ と同じと考えていいが、期待値という言葉は 確率変数 に対して使う。
確率変数とは試行[コインを投げるような行為]を行うたびに、具体的な値が決まるもののこと
(p.168)
《分散 $V$》=《[$n$ 個の数値の]2乗の期待値》-《期待値の2乗》
(p.174)
分散や標準偏差は驚きの度合いを表す
(p.184)
事象("event")より細かく分割できない事象を 根元事象 と呼ぶ。
そして、根元事象に対して値が定まる変数を 確率変数 という。
《コインを1回投げる》という試行の場合、《表が出る》と《裏が出る》という2種類の根元事象がある。
(p.185)
《コインを1回投げる》根元事象 | 《表が出る回数》を表す確率変数 $X$ の値 |
---|---|
《表が出る回数》 | $1$ |
《裏が出る回数》 | $0$ |
(確率変数 $X$ は確率分布をグラフにした際に横軸($x$軸)になるから $X$ )
この表はこう書くことも出来る
\begin{eqnarray}
\left\{
\begin{array}{l}
X (《表が出る回数》) = 1 \\
X (《裏が出る回数》) = 0 \\
\end{array}
\right.
\tag{1}
\end{eqnarray}
ゆえに、確率変数は《根元事象に対して値が定まる関数》ともいえる。
確率変数 $X$ が取る平均的な値を、その確率変数 $X$ の 期待値 と呼び、
$$ E[X] $$
と表す。"E"は《期待値》"Expected Value" の頭文字
(p.186)
確率変数 $X$ の期待値 $E[X]$ を、
$$E[X]=\sum k\cdot \Pr \left( X=k\right) $$
で定義する。ただし、$\sum$ は確率変数 $X$ が取りうるすべての値 $k$ についての和を取ることにする。
$\Pr \left( X=k\right)$ は、《確率変数 $X$ の値が $k$ に等しくなる確率》を表している。
$\Pr$ は《確率》"Probability" の頭文字
(p.187)
期待値は確率変数の平均なので、$μ$ と書くこともある。
しかし、$E[X]$ のように書けば、確率変数 $X$ の期待値であることがはっきりわかる。
《コインを1回投げる》という試行で、《表が出る回数》を表す確率変数を $X$ とすると、$X$ の期待値は、
$$
\begin{eqnarray}
E[X] &=& \sum_{k=0}^{1}k\cdot \Pr \left( X=k\right)\
&=& 0\cdot \Pr \left( X=0\right) + 1\cdot \Pr \left( X=1\right)
\end{eqnarray}
$$
で得られる。
$(1)$ より、$\Pr \left( X=1\right)$ は表が出る確率、 $\Pr \left( X=0\right)$ は裏が出る確率
(p.194)
二項分布
確率分布の一種 確率 $p$ で表が出るコインを $n$ 回投げたときに、《表が出る回数》を表す確率変数が従う確率分布 毎回のコイン投げは独立とする
$B(n, p)$
一様分布
どの根元事象も同じ確率で起きる
(p.198)
正規分布
二項分布の $n$ を大きくしていき、$n\rightarrow \infty$ の極限を取る。
様々な現象の統計量か正規分布で近似できる。単純な数理モデルの1つ。
(p.199)
二項分布は離散的な確率分布なので、確率は総和 ($\sum$)で得られる。
正規分布は連続な確率分布なので、縦軸は確率密度になり、確率は積分 ($\int$)の計算で得られる。
(p.201)
物理的な性質や、社会的な現象に対して、数学が直接的な証明を与えることはない。
数学はただ、数理モデルをどう扱うべきかを教えてくれるだけだ。
(p.214)
チェビシェフの不等式
いかなる分布でも、
$$μ-Kσ \lt x \lt μ+Kσ$$
を 満たさない 数値 $x$ の割合は、$\frac{1}{K^{2}}$ 以下である。
ただし $μ$ は平均、 $σ$ は標準偏差、$K$ は正の定数である。
(p.218)
[チェビシェフの不等式について]正規分布を仮定できる場合、$|x-μ|\geqq 2σ$ を満たす人数は約 $4%$ といえる。
しかし、分布がまったくわからない場合でも、平均と標準偏差がわかれば、$|x-μ|\geqq Kσ$ を満たす人数の割合は $\frac{1}{K^{2}}$ 以下であると保証できる。
(p.236)
二項分布の期待値・分散・標準偏差
\begin{eqnarray}
\left\{
\begin{array}{l}
期待値 = np \\
分散 = np(1-p) \\
標準偏差 = \sqrt{np(1-p)} \\
\end{array}
\right.
\end{eqnarray}
(cf.p.182)