集合と確率
集合:モノの集まり
集合の要素=元ともいう
ベン図
和集合A⋁B、共通部分A∧B ※積集合は別のことを指す
絶対補・相対補
確率
頻度確率(客観確率)・・・やればわかる、客観的
ベイズ確率(主観確率)・・・主観的、信念の度合い(算出が難しい)
確率の定義~全事象が起きる数に対するAが起きる数=P(A)
つまり0~1の間の値を取る
条件付確率
P(A|B)=P(A∧B)/P(B) ⇔ P(A∧B)=P(B)P(A|B)=P(A)P(B|A) Aが起きた条件下でBがおきる
独立な事象の時の同時確率
P(A∧B)=P(A)P(B) 積集合っぽい
P(A⋁B)=P(A)+P(B)-P(A∧B)
(P(A∧B)はベン図的に二重で数えているので引く)
ベイズ則
P(B)P(A|B)=P(A)P(B|A)
統計
記述統計・・・平均値、偏差、などなど特徴をわかりやすくするための学問
推測統計・・・標本から母集団を推測する学問
確率変数・・・事象と結びつけられた数値~賞金のようなもの(Ex.あたりで400円貰える、の400円の方)
確率分布・・・確率の分布~どのくらい当たるのかの分布(Ex.表が4枚出るのは1/16、の1/16の方)
※コインの表裏のようなときは二項分布
期待値:平均の値・・・(確率変数×確率)の平均値
分散:期待値の散らばり・・・{(期待値平均値)ー(個々の期待値)}^2
※二乗は計算のしやすさのため
(個々の期待値^2)の期待値 -(期待値平均値)^2 とも表される 計算しやすい
二乗の平均 - 平均の二乗
データの形を正確に表すために分散は必要
共分散:・・・2つデータの動きが似ていれば+or-、また関係ないなら0
~相関係数
標準偏差=√分散(単位系を合わせるため)
様々な確率分布
ベルヌーイ分布・・・コイントスイメージ どちらかが出る
⇒ どちらかが出る確率は等しくなくても使える μは足したら1
マルチヌーイ(カテゴリカル)分布・・・さいころのイメージ
⇒ 書き方はベルヌーイ分布と同じ。場合分けしているだけ
二項分布・・・組み合わせ(Combinataion)を考慮したベルヌーイ分布
⇒ 10回投げて5回表がでる、など
ガウス分布・・・釣り鐘型連続分布。正規分布。
⇒ 生産品のバラつきなど
※全体積分したら1になるように係数がつく
推定
目的:母集団(本当の集団)を特徴づける平均値などの統計量を推測すること
推定量:パラメータを推定する計算式(関数)のこと ~ 導関数みたいなもの
推定値:実際に計算した結果 ~ ある値を導関数に入れた時に出てくる値
注意)推定値はθハットとする。本当の値はθ(真値)。
標本平均:母集団から取り出した標本の平均値
一致性・・・サンプル数大で母集団の値に近づく
不偏性・・・サンプル数に影響されず、標本の期待値は母集団と一緒
(色々な標本平均値をとって、その平均値をとると母集団平均値と一緒)
標本分散:標本のバラつき
母集団のバラつきよりも標本分散は小さくなるのがわかっている
⇒ 不偏分散にすることで母集団分散に近づける(自由度を1つ下げる)