以下の統計検定2級対策動画で用いられているスライドの一部です。
具体例から考えてみよう
統計学の公式は、具体的なシナリオを想像すると理解しやすくなります。
今回は 3つの例題 を通して、2つの確率変数が関わる期待値や分散の計算方法を探っていきましょう。
- テストの合計点の 期待値
- サイコロの出目の積の 期待値
- 果物の合計重量の 分散
例題1:合計点の期待値
あるクラスの期末試験について考えてみましょう。
- 物理の点数: 確率変数 $X$
- 平均点(期待値): $E(X) = 65$ 点
- 化学の点数: 確率変数 $Y$
- 平均点(期待値): $E(Y) = 72$ 点
このとき、物理と化学の 合計点の期待値 $E(X+Y)$ はどうなるでしょうか?
例題1:解答
合計点の期待値は、それぞれの期待値を単純に足し合わせることで求められます。
$$
E(X+Y) = E(X) + E(Y)
$$
$$
E(X+Y) = 65 + 72 = 137
$$
よって、合計点の期待値は 137点 です。
この関係は、2つのテストの点数の関係性(得意・不得意など)に かかわらず、常に成り立ちます 。
例題2:出目の積の期待値
次に、2つの公正な6面サイコロAとBを同時に投げるケースです。
- サイコロAの出目: 確率変数 $X$
- サイコロBの出目: 確率変数 $Y$
それぞれの期待値は $E(X)=3.5$、 $E(Y)=3.5$ です。
このとき、出目の 積の期待値 $E(XY)$ はどうなるでしょうか?
例題2のポイント:「独立」
この問題を解く鍵は、「 独立 」という概念です。
独立である とは、一方の確率変数の結果が、もう一方の確率変数の結果に 一切影響を与えない 状態を指します。
サイコロAの出目が何であれ、サイコロBの出目には影響しません。したがって、$X$ と $Y$ は互いに独立です。
例題2:解答
2つの確率変数が 独立である場合 、その積の期待値は、それぞれの期待値を掛け合わせることで求められます。
$$
E(XY) = E(X)E(Y) \quad (X, Y\text{が互いに独立な場合})
$$
$$
E(XY) = 3.5 \times 3.5 = 12.25
$$
よって、出目の積の期待値は 12.25 となります。
例題3:合計重量の分散
ある農園で収穫されるリンゴとミカンの重さを考えます。
- リンゴの重さ($X$): $E(X) = 300$, $V(X) = 25$
- ミカンの重さ($Y$): $E(Y) = 80$, $V(Y) = 9$
今回は、ばらつきの大きさである 分散 について考えます。
リンゴとミカンを合わせた合計重量 $X+Y$ の 分散 $V(X+Y)$ はどうなるでしょうか?
例題3のポイント:「共分散」
合計の分散を計算するには、「 共分散 」という新しい指標が必要です。
共分散 とは、2つの確率変数がどの程度 同じ方向に動くか を示す指標です。
今回の例では、リンゴとミカンの重さの関係性を表す共分散を $Cov(X, Y) = 4$ とします。
共分散のイメージ
-
$Cov(X, Y) > 0$ ( 正の相関 )
- 一方が大きいと、もう一方も 大きくなる 傾向。
- 例:身長と体重
-
$Cov(X, Y) < 0$ ( 負の相関 )
- 一方が大きいと、もう一方は 小さくなる 傾向。
- 例:勉強時間とゲーム時間
-
$Cov(X, Y) \approx 0$ ( 無相関 )
- 2つの間に明確な線形の関係がない。
共分散の視覚化
import matplotlib.pyplot as plt
import numpy as np
# Set seed for reproducibility
np.random.seed(42)
# Generate data
x1 = np.random.rand(100) * 10
y1 = 2 * x1 + np.random.randn(100) * 2
cov1 = np.cov(x1, y1)[0, 1]
x2 = np.random.rand(100) * 10
y2 = -2 * x2 + np.random.randn(100) * 2
cov2 = np.cov(x2, y2)[0, 1]
x3 = np.random.rand(100) * 10
y3 = np.random.randn(100) * 5
cov3 = np.cov(x3, y3)[0, 1]
# Create subplots
fig, axs = plt.subplots(1, 3, figsize=(18, 5))
fig.suptitle('Visualization of Covariance', fontsize=16)
# Plot 1: Positive Correlation
axs[0].scatter(x1, y1, alpha=0.7)
axs[0].set_title(f'Positive Correlation\nCov(X, Y) = {cov1:.2f}')
axs[0].set_xlabel('X')
axs[0].set_ylabel('Y')
# Plot 2: Negative Correlation
axs[1].scatter(x2, y2, alpha=0.7, color='orange')
axs[1].set_title(f'Negative Correlation\nCov(X, Y) = {cov2:.2f}')
axs[1].set_xlabel('X')
# Plot 3: No Correlation
axs[2].scatter(x3, y3, alpha=0.7, color='green')
axs[2].set_title(f'No Correlation\nCov(X, Y) = {cov3:.2f}')
axs[2].set_xlabel('X')
plt.tight_layout(rect=[0, 0, 1, 0.96])
plt.show()
例題3:解答
合計の分散は、それぞれの分散の和に、 共分散の2倍 を加えて計算します。
$$
V(X+Y) = V(X) + V(Y) + 2Cov(X, Y)
$$
$$
V(X+Y) = 25 + 9 + 2 \times 4 = 42
$$
よって、合計重量の分散は 42 となります。
($Cov=4$ なので、重いリンゴが採れると重いミカンも採れる傾向があるようです。)
もし独立だったら? (分散)
もしリンゴとミカンの重さが互いに 独立 であれば、2つの間に関係性はないため、 $Cov(X,Y)=0$ となります。
その場合、分散の計算は非常にシンプルになります。
$$
V(X+Y) = V(X) + V(Y)
$$
$$
V(X+Y) = 25 + 9 = 34
$$
差の分散はどうなる?
もし重さの 差 の分散 $V(X-Y)$ を計算したい場合は、共分散の項を 引きます 。
$$
V(X-Y) = V(X) + V(Y) - 2Cov(X, Y)
$$
重要ポイント:
もし独立なら、$Cov(X,Y)=0$ なので $V(X-Y) = V(X) + V(Y)$ となります。
差の分散でも、それぞれの分散の 和 になる点に注意してください。
一般化と定義
ここまでの具体例を踏まえて、公式としてまとめましょう。
- 期待値の性質
- 共分散の定義
- 分散の性質
定義:期待値の性質
-
和の期待値
- 常に成り立ちます。
$$
E(X+Y) = E(X) + E(Y)
$$
- 常に成り立ちます。
-
積の期待値
- $X$と$Y$が 互いに独立な場合 にのみ成り立ちます。
$$
E(XY) = E(X)E(Y)
$$
- $X$と$Y$が 互いに独立な場合 にのみ成り立ちます。
定義:共分散
-
定義式
- それぞれの偏差の積の期待値として定義されます。
$$
Cov(X, Y) = E[{X - E(X)}{Y - E(Y)}]
$$
- それぞれの偏差の積の期待値として定義されます。
-
計算式
- 実際の計算では、こちらの式が便利です。
$$
Cov(X, Y) = E(XY) - E(X)E(Y)
$$
- 実際の計算では、こちらの式が便利です。
確率変数が 独立 ならば 共分散は0 ですが、その逆(共分散が0ならば独立)は必ずしも成り立ちません。
定義:分散の性質
-
和の分散
$$
V(X+Y) = V(X) + V(Y) + 2Cov(X, Y)
$$ -
差の分散
$$
V(X-Y) = V(X) + V(Y) - 2Cov(X, Y)
$$ -
$X, Y$が独立の場合 ($Cov(X,Y)=0$)
$$
V(X+Y) = V(X-Y) = V(X) + V(Y)
$$
まとめ:公式一覧
| 対象 | 公式 | 条件 |
|---|---|---|
| 和の期待値 | $E(X+Y) = E(X) + E(Y)$ | 常に成立 |
| 積の期待値 | $E(XY) = E(X)E(Y)$ | $X, Y$ が 独立 |
| 共分散 | $Cov(X, Y) = E(XY) - E(X)E(Y)$ | (計算式) |
| 和の分散 | $V(X+Y) = V(X) + V(Y) + 2Cov(X, Y)$ | 一般形 |
| $V(X+Y) = V(X) + V(Y)$ | $X, Y$ が 独立 | |
| 差の分散 | $V(X-Y) = V(X) + V(Y) - 2Cov(X, Y)$ | 一般形 |
| $V(X-Y) = V(X) + V(Y)$ | $X, Y$ が 独立 |
