確率変数の周辺化とは
確率変数の周辺化とは同時確率分布においてある確率変数を削除して新しい確率分布を作成する操作のことです
こんなかたっ苦しくいわれても分かるわけがないので、具体例を元に説明していきます
同時確率分布とは
本題を前に同時確率分布について説明します
同時確率分布とは複数の確率変数を持つ確率分布のことですが、定義だけでは分からないのでこれも具体例を元に説明します
以上のような質問を全国から無作為に抽出した 100 人の人に質問します(ちなみに僕はマクドナルドが一番好きです)
すると以下の結果が得られました
性別 | マクドナルド | モスバーガー | ロッテリア | 合計 |
---|---|---|---|---|
男性 | 30 | 20 | 6 | 56 |
女性 | 3 | 23 | 18 | 44 |
合計 | 33 | 43 | 24 | 100 |
今回は確率の話をしているため全て 100 で割ります
性別 | マクドナルド | モスバーガー | ロッテリア | 合計 |
---|---|---|---|---|
男性 | 3 / 10 | 1 / 5 | 3 / 50 | 14 / 25 |
女性 | 3 / 100 | 23 / 100 | 9 / 50 | 11 / 25 |
合計 | 33 / 100 | 43 / 100 | 6 / 25 | 1 |
このときアンケートを取るという事象には、2 つの確率変数 x = アンケートを取った相手が男性か女性かと y=好きなお店がマクドナルドかモスバーガーかロッテリアのどれが選ばれたかが存在すると定義できます
また、x の確率を p(x)、y の確率を p(y)とします
このとき、同時確率分布とは p(x, y)を指します
このように同時確率分布とはある事象と別のある事象の積事象における確率分布のことを指します
改めて確率変数の周辺化とは
改めて本題に入っていきます
同時確率分布が理解できれば確率変数の周辺化もすぐに理解できます
先ほどのハンバーガー店の例を元に考えると赤枠、青枠の部分が周辺化した確率分布の結果です
確率変数の周辺化とは同時確率分布においてある確率変数を削除して新しい確率分布を作成することです
つまり、確率変数を削除した合計の部分を指すのです
また、p(x, y)から x を削除することをp(x,y)を x で周辺化する、逆に y を削除することをp(x,y)を y で周辺化すると言います
参考記事