Python3ではじめるシステムトレード：確率変数と独立

Python

Last updated at 2024-05-27Posted at 2024-05-27

長い間、正確に理解できていなかったので、メモとして残しておきます。

確率変数 $ X $ が正規分布 $ N(\mu, \sigma_X^2) $ に従う場合、その確率密度関数（PDF）は次の式で表されます：

$$
f(x) = \frac{1}{\sqrt{2\pi \sigma_X^2}} e^{-\frac{(x-\mu_X)^2}{2\sigma_X^2}}
$$

ここで、

$ \mu_X $ は分布の平均（期待値）です。
$ \sigma_X $ は標準偏差で、$ \sigma_X^2 $ は分布の分散です。

この関数は $ x $ の値に対して確率密度を与え、$ \mu_X $ を中心に対称なベル形のカーブを描きます。

この際に確率変数$X$は独立です。

どうように、確率変数 $ Y $ が正規分布 $ N(\mu, \sigma_X^2) $ に従う場合、その確率密度関数（PDF）は次の式で表されます：

$$
f(y) = \frac{1}{\sqrt{2\pi \sigma_Y^2}} e^{-\frac{(y-\mu_Y)^2}{2\sigma_Y^2}}
$$

ここで、

$ \mu_Y $ は分布の平均（期待値）です。
$ \sigma_Y $ は標準偏差で、$ \sigma_Y^2 $ は分布の分散です。

この関数は $ Y $ の値に対して確率密度を与え、$ \mu_Y $ を中心に対称なベル形のカーブを描きます。

この際に確率変数$Y$は独立です。

この場合の同時確率密度関数は

確率変数 $ X $ と $ Y $ がそれぞれ独立して正規分布 $ N(\mu_X, \sigma_X^2) $ と $ N(\mu_Y, \sigma_Y^2) $ に従う場合、それぞれの確率密度関数は以下のようになります：

$$
f_X(x) = \frac{1}{\sqrt{2\pi \sigma_X^2}} e^{-\frac{(x-\mu_X)^2}{2\sigma_X^2}}
$$

$$
f_Y(y) = \frac{1}{\sqrt{2\pi \sigma_Y^2}} e^{-\frac{(y-\mu_Y)^2}{2\sigma_Y^2}}
$$

これらが独立しているとき、$ X $ と $ Y $ の同時確率密度関数は両者の密度関数の積となります。この場合、同時密度関数 $ f(x, y) $ は次のように表されます：

$$
f(x, y) = f_X(x) \cdot f_Y(y) = \left(\frac{1}{\sqrt{2\pi \sigma_X^2}} e^{-\frac{(x-\mu_X)^2}{2\sigma_X^2}}\right) \cdot \left(\frac{1}{\sqrt{2\pi \sigma_Y^2}} e^{-\frac{(y-\mu_Y)^2}{2\sigma_Y^2}}\right)
$$

これを展開すると、

$$
f(x, y) = \frac{1}{2\pi \sigma_X \sigma_Y} e^{-\left(\frac{(x-\mu_X)^2}{2\sigma_X^2} + \frac{(y-\mu_Y)^2}{2\sigma_Y^2}\right)}
$$

となります。これにより、$ x $ と $ y $ の値に対する同時確率密度が計算されます。

確率変数 $ X $ と $ Y $ が相関関係にある場合、通常これらは多変量正規分布、特に二変量正規分布を用いてモデル化されます。二変量正規分布の同時確率密度関数は次のように表されます：

$$
f(x, y) = \frac{1}{2\pi \sigma_X \sigma_Y \sqrt{1-\rho^2}} \exp\left(-\frac{1}{2(1-\rho^2)}\left[\frac{(x-\mu_X)^2}{\sigma_X^2} - 2\rho\frac{(x-\mu_X)(y-\mu_Y)}{\sigma_X \sigma_Y} + \frac{(y-\mu_Y)^2}{\sigma_Y^2}\right]\right)
$$

ここで、

$ \mu_X $ と $ \mu_Y $ はそれぞれ $ X $ と $ Y $ の平均です。
$ \sigma_X $ と $ \sigma_Y $ はそれぞれ $ X $ と $ Y $ の標準偏差です。
$ \rho $ は $ X $ と $ Y $ の間の相関係数で、値は $-1$ から $1$ の範囲です。

この同時密度関数は、$ X $ と $ Y $ の間にどの程度の相関が存在するかを示す $ \rho $ を含んでおり、$ \rho = 0 $ の場合は $ X $ と $ Y $ が独立であるとして、上述の独立な場合の同時密度関数に帰着します。相関係数 $ \rho $ が $ 0 $ 以外の場合、これら二つの変数間には直線的な関係があると想定され、その強さと方向が $ \rho $ によって調整されます。

つぎに確率変数$X_1,\cdots,X_n$を考えます。どちらも同じ確率密度関数から取られています。この場合には$X$は$X$に関して独立です。また$Y$も$Y$に関して同様です。しかし、確率変数$X$と$Y$の間には相関があるので、独立ではありません。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up