数学
統計
統計学
統計学入門
確率

結城 浩『数学ガールの秘密ノート/やさしい統計』勉強メモ

More than 1 year has passed since last update.

参考文献

1) 結城 浩『数学ガールの秘密ノート/やさしい統計』 SBクリエイティブ、2016年。

代表値

最大値、最小値、平均 $μ$、最頻値、中央値


(pp.86-87)
偏差の2乗平均を分散 $V$ ("Variance") という

(p.109)
《分散 $V$》=《[$n$ 個の数値の]2乗の平均》-《平均の2乗》

(p.121)
標準偏差 $σ$
分散の平方根のうち、負でないほう
すなわち、分散を $V$ とし、標準偏差 $σ$ とすると
$$ σ = \sqrt{V}$$
である。

(p.138)
正規分布のグラフを平均 $μ$ から、標準偏差 $σ$ ごとに区切ると、
おおよそ $34\%, 14\%, 2\%$ という割合が現れる。

(p.151)
平均 $μ$ は期待値 $μ$ と同じと考えていいが、期待値という言葉は 確率変数 に対して使う。
確率変数とは試行[コインを投げるような行為]を行うたびに、具体的な値が決まるもののこと

(p.168)
《分散 $V$》=《[$n$ 個の数値の]2乗の期待値》-《期待値の2乗》

(p.174)
分散や標準偏差は驚きの度合いを表す

(p.184)
事象("event")より細かく分割できない事象を 根元事象 と呼ぶ。
そして、根元事象に対して値が定まる変数を 確率変数 という。
《コインを1回投げる》という試行の場合、《表が出る》と《裏が出る》という2種類の根元事象がある。

(p.185)

《コインを1回投げる》根元事象 《表が出る回数》を表す確率変数 $X$ の値
《表が出る回数》 $1$
《裏が出る回数》 $0$

(確率変数 $X$ は確率分布をグラフにした際に横軸($x$軸)になるから $X$ )

この表はこう書くことも出来る

\begin{eqnarray}
  \left\{
    \begin{array}{l}
      X (《表が出る回数》)   = 1 \\
      X (《裏が出る回数》)   = 0 \\
    \end{array}
  \right.
  \tag{1}
\end{eqnarray}

ゆえに、確率変数は《根元事象に対して値が定まる関数》ともいえる。

確率変数 $X$ が取る平均的な値を、その確率変数 $X$ の 期待値 と呼び、
$$ E[X] $$
と表す。"E"は《期待値》"Expected Value" の頭文字

(p.186)
確率変数 $X$ の期待値 $E[X]$ を、

$$E[X]=\sum k\cdot \Pr \left( X=k\right) $$
で定義する。ただし、$\sum$ は確率変数 $X$ が取りうるすべての値 $k$ についての和を取ることにする。
$\Pr \left( X=k\right)$ は、《確率変数 $X$ の値が $k$ に等しくなる確率》を表している。
$\Pr$ は《確率》"Probability" の頭文字

(p.187)
期待値は確率変数の平均なので、$μ$ と書くこともある。
しかし、$E[X]$ のように書けば、確率変数 $X$ の期待値であることがはっきりわかる。

《コインを1回投げる》という試行で、《表が出る回数》を表す確率変数を $X$ とすると、$X$ の期待値は、

$$
\begin{eqnarray}
E[X] &=& \sum_{k=0}^{1}k\cdot \Pr \left( X=k\right)\
&=& 0\cdot \Pr \left( X=0\right) + 1\cdot \Pr \left( X=1\right)
\end{eqnarray}
$$
で得られる。

$(1)$ より、$\Pr \left( X=1\right)$ は表が出る確率、 $\Pr \left( X=0\right)$ は裏が出る確率

(p.194)

二項分布

確率分布の一種 確率 $p$ で表が出るコインを $n$ 回投げたときに、《表が出る回数》を表す確率変数が従う確率分布 毎回のコイン投げは独立とする

$B(n, p)$

一様分布

どの根元事象も同じ確率で起きる

(p.198)

正規分布

二項分布の $n$ を大きくしていき、$n\rightarrow \infty$ の極限を取る。
様々な現象の統計量か正規分布で近似できる。単純な数理モデルの1つ。

(p.199)
二項分布は離散的な確率分布なので、確率は総和 ($\sum$)で得られる。
正規分布は連続な確率分布なので、縦軸は確率密度になり、確率は積分 ($\int$)の計算で得られる。

(p.201)

物理的な性質や、社会的な現象に対して、数学が直接的な証明を与えることはない。
数学はただ、数理モデルをどう扱うべきかを教えてくれるだけだ。


(p.214)

チェビシェフの不等式

いかなる分布でも、
$$μ-Kσ \lt x \lt μ+Kσ$$
満たさない 数値 $x$ の割合は、$\frac{1}{K^{2}}$ 以下である。

ただし $μ$ は平均、 $σ$ は標準偏差、$K$ は正の定数である。


(p.218)

[チェビシェフの不等式について]正規分布を仮定できる場合、$|x-μ|\geqq 2σ$ を満たす人数は約 $4\%$ といえる。

しかし、分布がまったくわからない場合でも、平均と標準偏差がわかれば、$|x-μ|\geqq Kσ$ を満たす人数の割合は $\frac{1}{K^{2}}$ 以下であると保証できる。

(p.236)

二項分布の期待値・分散・標準偏差

\begin{eqnarray}
  \left\{
    \begin{array}{l}
      期待値 = np \\
      分散 = np(1-p) \\
      標準偏差 = \sqrt{np(1-p)} \\
    \end{array}
  \right.
\end{eqnarray}

(cf.p.182)