定義
【離散の場合】
\begin{align*}
E(X)&=\Sigma_x xP(X=x) ※\Sigma_xはxがとりうる全ての値に関する和\\
\end{align*}
【連続の場合】
\begin{align*}
E(X)=\int _{-\infty}^{\infty } xP(x)dx\\
\end{align*}
性質
\begin{align*}
&E(aX+b)=aE(X)+b\\
&E(X+Y)=E(X)+E(Y)\\
\end{align*}
これはX,Yが独立でなくても成り立つ
【証明】
離散の場合を証明するが連続の場合も同じ方法でOK。
\begin{align*}
E(aX+b)&=\Sigma_x(ax+b)P(X=x)\\
&=a\Sigma_x(x)P(X=x)+b\Sigma_xP(X=x)\\
&=aE(X)+b\\
E(X+Y)&=\Sigma_x\Sigma_y(x+y)P(X=x,Y=y)\\
&=\Sigma_x\Sigma_yxP(X=x,Y=y)+\Sigma_x\Sigma_yyP(X=x,Y=y)\\
&=\Sigma_xx\Sigma_yP(X=x,Y=y)+\Sigma_yy\Sigma_xP(X=x,Y=y)\\
&=\Sigma_xxP(X=x)+\Sigma_yyP(Y=y)\\
&=E(X)+E(Y)
\end{align*}
【証明の補足】
$b\Sigma_xP(X=x)=b$となる理由
$\Sigma_xP(X=x)$について、これはつまりXのとりうる全ての値についてその確率を足しているので=1になる。
$\Sigma_xx\Sigma_yP(X=x,Y=y)=\Sigma_xxP(X=x)$となる理由
$P(X=x,Y=y)$というのは$X=x$でかつ$Y=y$となる確率を表す。
例えば大のサイコロ(X)と小のサイコロ(Y)を振ってそれぞれ1,3になる確率だったら$P(X=1,Y=3)$と書く。
$\Sigma_yP(X=x,Y=y)$というのは$y$として取りうる値全てを足しているわけだから、$=P(X=x)$になる。
サイコロの例でいうと、$x=1$の場合、
$\Sigma_yP(X=1,Y=y)=P(X=1,Y=1)+P(X=1,Y=2)+...+P(X=1,Y=6)$になる。これはつまり大のサイコロが1になる確率$P(X=1)$と同じ。