お疲れ様です、Fortranです。
今回は読書メモというか、勉強メモになります。
#はじめに
##なぜ統計学?
統計学を理解したいと思った理由は、下記が主となります。
- 統計モデルや機械学習等を使って、インフラ周りの色んな予測を立てているが、そのバックヤードについては理解しておらず、説明に窮する場面があるので、しっかり理解をしておきたい。
- 統計検定に興味が湧いてきたため、まずは2級の合格を目指したい。
##統計検定とは?
http://www.toukei-kentei.jp/
統計検定とは、日本統計学会が公式で認定している統計学に関する検定のことで、1級、準1級、2級、3級、4級があります。今回私がターゲットにしている2級は、大学1年・2年で習得するレベルに達しているか、を測る試験です。
大学で統計学を勉強してこなかった私にとっては、まずは統計学って何だっけ?からスタートすることになります。
##目指したいレベル
- 部署内に「統計学とは」というタイトルで勉強会できるレベルになりたい
- 統計検定2級をまずは合格したい
#読書メモ
##第1章
###平均、分散、標準偏差
- 平均(mean)
- 平均の求め方は次の式で記述される。
- 変量とは、資料の各々の値のこと。
- $X$をサンプルとすると、変数は$E(X)$で表現される。
平均=\frac{資料の変量の総和}{資料の個数}
- 分散(variance)
- 偏差は、各々の変量に対して、$変量-平均$としたもの
- $V(X)$と数式では表される。
分散=偏差の2乗の平均=\frac{偏差の2乗の総和}{資料の個数}
- 標準偏差
- 数式では$\sqrt{V(X)}$で表される。
標準偏差=\sqrt{分散}
###平均値と分散の特性
- 全体の変量に対して$+a$とした時の平均$E(X+a)$と分散$V(X+a)$は次のようになる。
- 証明は省く。
E(X+a)=E(X)+a , V(X+a)=V(X)
- また、全体の変量$X$に対して、$aX$とした場合の平均、分散は次のようになる。
E(aX)=aE(X), V(aX)=a^{2}V(X)
###正規分布
- 平均$\mu$、標準偏差$\sigma$が与えられている資料があるとする。
E(X)=\mu, V(X)=\sigma
- この$X$を標準化(平均$0$、標準偏差$1$になるよう変数変換する)すると、下記のようになる。
- 標準正規分布$N(0,1^{2})$という。
E \biggl( \frac{X-\mu}{\sigma} \biggl)=0, V\biggl( \frac{X-\mu}{\sigma} \biggl)=1
- この正規分布の曲線は、下記の数式であらわされる。
f(x)=\frac{1}{\sqrt{2\pi}}\exp \bigg( -\frac{x^{2}}{2}\bigg)
###推定
-
母集団:特性を調べたい思っているデータ
-
標本:母集団の特性を調べるためにランダムに抽出したもの
-
調査について
-
全件調査:母集団すべてについて調査すること
-
標本調査:母集団から取り出した標本について調査すること
-
点推定
-
不偏推定量による推定・・・通常、分散は偏差の2乗の総和を資料の個数で割るところを、資料の個数-1で割る流儀
-
最尤法による推定・・・変わらず
-区間推定
###検定
- 部分から特徴の特性を判定する
- 帰無仮説($H_{0}$)と対立仮説($H_{1}$)
- 帰無仮説:最初に立てた仮説
- 対立仮説:帰無仮説に対する反対の仮説
- 検定の手順
- ステップ①:帰無仮説$H_{0}$と対立仮説$H_{1}$を立てる。
- ステップ②:帰無仮説$H_{0}$が正しいとして、標本の検定統計量$T$を計算する。
- ステップ③:ステップ②でえられた値が、統計量Tが従う分布で棄却域にあるか否かを判定する。
- 棄却域にあれば、帰無仮説$H_{0}$は棄却される。対立仮説$H_{1}$が採択される。
- 棄却域になければ、帰無仮説$H_{0}$が採択される。
#おわりに
本日はここまで。復習で色々追記することがあると思います。
次回は、第2章について勉強していきたいと思います。