確率変数
確率変数とは、取る値の範囲と取る確率だけが分かっており、試行の結果によってその値をとる確率がランダムに定まる変数です。試行によって確率変数Xがとる値をXの実現値と言います。
10円玉を4回投げた時に「表」の出る回数をxとすると、xはある確率(1/2)のもとで0,1,2,3,4のいずれかの値を取ります。この場合、確率変数Xとその起こる確率P(X)との関係を表した確率分布は以下のように表されます。
確率変数 X | 0 | 1 | 2 | 3 | 4 |
---|---|---|---|---|---|
確率 P(X) | 1/16 | 1/4 | 3/8 | 1/4 | 1/16 |
離散型確率変数
確率変数Xがとびとびの値で有限個の値をとる場合**「離散型確率変数**」と言えます。
サイコロやコイン投げ、世論調査の結果(賛成・反対を0と1で表す)などが該当します。
連続型確率変数
確率変数Xが連続的な値(区間内の全ての実数値)をとる場合**「連続型確率変数」**と言えます。
身長や体重などのデータが該当します。
確率質量関数
離散型確率変数Xがある値xをとる確率を関数f(x)とした場合、f(x)は**「確率質量関数」**と呼ばれます。
f(x)を用いると、X=x(ある値x)となる確率は次のように表されます。
f(x_i)=P(X=x_i) (i=1,2,…,n)
確率質量関数は以下の特徴を持ちます。(確率の総和は1である)
0 \leq f(x_i)\leq 1 \sum_{i=1}^{n} f(x_i)=1
確率密度関数
連続型確率変数Xがある値をとる関数f(x)とした場合、f(x)は**「確率密度関数」**と呼ばれます。
確率変数Xがある閉区間[a,b]をとる確率をPとした場合、その確率を与える関数f(x)は積分の形(確率=面積となる)で次のように表されます。
P(a\leq X\leq b)=\int_{a}^{b}f(x)dx
確率密度関数は以下の特徴を持ちます。
(確率変数Xの取りうる値の下限を-∞・上限を∞とする・確率の総和は1である)
f(x)\geq 0 \int_{-∞}^{∞}f(x)dx=1
累積分布関数
確率変数Xがある値x以下の値となる確率を累積分布関数と言い、次のように表します。
F(x)=P(X \leq x)
確率変数が連続型である場合、累積分布関数は**確率密度関数の-∞からxまでの定積分(面積)**であると考えることができ、確率密度関数をf(t)と置くと、次のように表すことができます。
F(x)=P(X \leq x)=\int_{-∞}^{x}f(t)dt
累積分布関数F(x)は確率密度関数f(x)を積分することで求められ、逆に確率密度関数f(x)は累積分布関数F(x)を微分することで求められます。
また、累積分布関数は単調増加関数であり、右連続である(xが点aに右から近づいた時、関数f(x)が途切れることなくaにたどり着くことができる)と言えます。
画像引用:技術計算製作所
期待値
期待値とは、確率変数Xの取りうる値にそれが起こる確率を掛け合わせた総和であり、確率変数の全ての値に確率の重みをつけた加重平均、つまり**「確率変数の平均値」**であると言えます。
離散型確率変数Xが、x1,x2,…,xnの値をとり、それに対応する確率がそれぞれp1,p2,…,pnであるとき、期待値E[X]は以下のように表されます。
E[X]=x_1p_1+x_2p_2+…+x_np_n
=\sum_{i=1}^{n}x_ip_i
また連続型確率変数Xの期待値は確率密度関数f(x)を用いて次のように表されます。
E[X]=\int_{-∞}^{∞}xf(x)dx
期待値の性質
期待値に関して覚えておくべき公式です。(X・Yは確率変数、aは定数)
E[a]=a
E[X+a]=E[X]+a
E[aX]=aE[X]
E[X+Y]=E[X]+E[Y]
XとYが互いに独立であるなら、E[XY]=E[X]E[Y]
確率変数の分散
確率変数の散らばりの大きさを表す**確率変数の分散V[X]**は以下のように表されます。
(Xの期待値(平均)を E[X]=μ とする)
V[X]=\sum_{i=1}^{n}p_i(x_i-\mu)^2
=E[(X-\mu)^2]
=E[X^2]-(E[x])^2
※なお確率変数ではない(期待値を用いない)分散は以下のように定義されます。
σ^2=\frac{1}{n} \sum_{i=1}^{n} (x_i-\mu)^2
確率変数の分散の性質
確率変数の分散に関して覚えておくべき公式です。(X・Yは確率変数、aは定数、Cov[X,Y]は確率変数X,Yの共分散)
V[a]=0 (定数は確率による散らばりが無い)
V[X+a]=V[X]
V[aX]=a^2V[X]
V[X+Y]=V[X]+V[Y]+2Cov[X,Y]
XとYが互いに独立であるなら、V[X+Y]=V[X]+V[Y] (独立であるため共分散が0である)
確率変数の共分散
2つの確率変数の関係の大きさを表す**確率変数の共分散Cov[X,Y]**は以下のように表されます。
Cov[X,Y]=E[(X-\mu_x)(Y-\mu_y)]
=E[XY]-E[X]E[Y]
※なお確率変数ではない(期待値を用いない)共分散は以下のように定義されます。
S_{xy}=\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})(y_i-\bar{y})
共分散は2つのデータの関係を示しますが、「2つのデータの関係の強さ」と**「データの単位」**の両方によって影響を受けるので、単位の影響を受けない相関係数rがデータ間の関係を表す際には多く用いられます。
確率変数の標準偏差
確率変数の共分散は以下のように定義されます。
σ_x=\sqrt{V[X]}