条件付き独立性とは?
条件付き独立性(Conditional Independence)は、確率論や統計学において、2つの確率変数が与えられた条件下で独立であることを指します。具体的には、3つの確率変数 X, Y, Z について、Z が与えられたとき、X と Y が独立である場合、X と Y は Z に関して条件付き独立であると言います。
数学的定義
条件付き独立性は以下のように定義されます:
P(X, Y | Z) = P(X | Z) ・ P(Y | Z)
これは、Z が与えられたとき、X と Y の同時確率が、それぞれの周辺確率の積に等しいことを意味します。言い換えれば、Z が既知である場合、X と Y は互いに影響を与えないということです。
具体例
例えば、以下のような疑似相関の状況を考えます:
- X: 身長
- Y: 学力
- Z: 年齢
ここで、Z(年齢)が与えられたとき、X(身長)と Y(学力)は条件付き独立であるとします。つまり、Z(年齢)を指定している場合、X(身長)とY(学力)は互いに影響を与えないということです。
一方で年齢を指定しない場合、は身長と学力に相関がある(身長が高いほど高学年になるので、学力は高くなる)ので、独立ではありません。
*deepseek先生に教えてもらいました。