3
5

確率・統計についての勉強メモ

Last updated at Posted at 2021-08-27

書籍「データ指向のソフトウェア品質マネジメント」を読んで、確率・統計についてのわかりなかったこと・調べたこと・わかったことをメモ。

1. 記号

2. JISの用語定義

3. 基本統計量(要約統計量)

尺度

リッカート式尺度

パーセンタイル

平均

標準偏差

Zスコア(Z値、標準得点)

変動係数

4. 統計図表

ヒストグラム

箱ひげ図

QQプロット

管理図

5. 標本調査

標本と母集団

母分散と母標準偏差

自由度

6. 分布

歪度(わいど)と尖度(せんど)

二項分布

パスカルの三角形

正規分布

標準正規分布(Z分布)

中心限界定理

対数正規分布

小室睦さんの解説メモ

いろいろな要因が足し算で効いてくるものは正規分布に近くなります。一方、ソフトウェア開発でよくでてくる規模とか欠陥の個数などは要因が「掛け算」で効いてくるので、掛け算を足し算に直す変換である「対数」を一度とると正規分布に近くなります。(対数正規分布)

t分布

ポアソン分布

7. 確率基礎概念

確率の計算(順列・組み合わせ)

累積分布関数と確率密度関数

8. 推定

9. 検定

帰無仮説と対立仮説

P値

検定の種類

t検定

検定手法 説明 事例
1標本t検定 サンプルから得られる平均値が仮定した値と差があるかを調べる https://www.statweb.jp/method/t-kentei/1hyouhon-tkentei-case
独立サンプルt検定(対応の無いデータによる2群の母平均の差のt検定) 2つの母集団から得たサンプルの平均値に差があるかを調べる https://www.statweb.jp/method/t-kentei/2hyouhon-tkentei-case
対応のあるt検定(対応の有るデータによる2群の母平均の差のt検定) 1つのサンプルから、条件を変えて2つのデータを収集し、それらに差があるかを調べる https://www.statweb.jp/method/t-kentei/taiou-heikinchi-case

F検定

分散分析

  • 誤差による影響(誤差変動)と説明変数による影響(要因変動)がある

カイ二乗検定

TBD

10. 相関分析と回帰分析

相関

相関係数は散布図上の各点と平均の点で出来る長方形面積の足し合わせたものとイメージ。
符号も含めて考えるので右上と左下象元の長方形面積はプラス、右下と左上の象元はマイナスとなる。
x,yとも飛びぬけて大きな値が有ると、その値が支配的となり、その値の面積が効いて来る。

相関係数

偏相関係数

回帰

寄与率(決定係数)

  • 寄与率は、重回帰分析の場合は、Adjusted R-squared(自由度調整済み寄与率)のほうを見る。

重回帰分析

ステップワイズ法

信頼区間と区間予測

ダミー変数

多重共線性

11. 統計モデル

べき乗則

TBD

12. 田中嘉博氏のYouTubeチャンネル

統計の用語をかなりわかりやすく解説してくださっている動画がたくさんある。
もしかしたら、田中嘉博氏のYouTubeチャンネルへのリンクだけあれば十分なのかも。それくらいわかりやすく充実した説明がありそう。

13. 秋山浩一氏の記事「統計の実務」

秋山浩一さんが、「実務」で道具として統計を使う方法を説明してくださっています。
Rコマンダーを使った方法を紹介してくださっています。

14. おまけ

15. 書籍

3
5
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
5