はじめに
本記事では(Rubin的な)統計的因果推論の考え方についてまとめます。筆者は統計の専門家ではないため誤りがあればご指摘いただけると幸いです。
参考
「統計的因果推論」についてまとめるあたって下記を参考にしています。
- 統計学の時間
- 統計学入門 (基礎統計学Ⅰ) 東京大学教養学部統計学教室
- 仮説検定とは?
- The central role of the propensity score in observational studies for causal effects
効果検証の考え方
「施策の本当の効果」検証するのは実は容易ではありません。とあるECサイトの販売促進メルマガの効果を検証したいと考えたとき、メールを送った人とメールを送っていない人の売り上げ平均を単純に比較するだけでは「施策の本当の効果」を検証することはできません。今回は効果検証をするに当たってその前提となる考え方をまとめていきます。
効果の定義
個体処置効果(ITE)
まずある特定の人(個体)に対する施策の効果について定義します。
$i$さんにメルマガを送付した時に$i$さんから得られる売り上げを$Y_{i}(1)$
$i$さんにメルマガを送付しなかった時に時に$i$さんから得られる売り上げを$Y_{i}(0)$とします。
$i$さんに対する結果は下記2つの数字の組で表されます。
{$Y_{i}(1),Y_{i}(0)$}
$i$さんに対する施策の効果は下記になります。
$\tau_{i}=Y_{i}(1)-Y_{i}(0)$
この$\tau_{i}$は**個体処置効果(individual tretment effect:ITE)**と呼ばれます。
もし施策を実施した場合の結果から施策を実施しなかった場合の結果を引いているかたちになっています。しかし現実世界では{$Y_{i}(1),Y_{i}(0)$}の2つの結果のどちらかしか観測することができません。
常に片方の値が欠けていることから、Rubinさんは「因果推論の本質は欠損データの問題である」と捉えています。
こういった考え方を反実仮想モデルやPotential Outcomeモデルと呼びます。
平均処置効果(ATE)
平均処置効果は母集団全体での個体処置効果の期待値を表します。
$\tau=E[Y(1)-Y(0)] = E[Y(1)]-E[Y(0)] (=\tau_{1} - \tau_{0})$
差の期待値は期待値の差であるので、全ての個体に処置をした時の期待値から全ての個体に処置をしなかった時の期待値を引いたものが平均処置効果になります。
先ほどの例を使うと、全ての人にメルマガを送付した時の売り上げの期待値から全ての人にメルマガを送付しなかった時の期待を引いたものが、メルマガの効果の期待値になる、ということです。
しかし$\tau_{1}$と$\tau_{0}$はどちらか一つしか観測することはできません。現実世界では「メルマガを全員に送付する」という状態と「メルマガを全員に送付しない」という2つの状態のどちらかしか存在し得ません。
現実存在し得ない式を定義する理由はこの状態を理想と考えて限りなく理想状態に近い状態を作って効果検証をするためです。そのための条件を次は見ていきます。
効果検証の条件
SUTVA条件
先ほどの項にて個体処置効果について説明を行いましたが、それが実際に意味を持つにはSUTVA条件(stable unit value assumption)を満たす必要があります。
その条件は以下の2つです。
①個体$i$の潜在的な効果{$Y_{i}(1),Y_{i}(0)$}は他の個体のうける処置に依存しない。
②個体$i$に対する処置は1通りに定まる。
①は相互干渉がない、とういう状態です。メルマガの例だとあまり相互干渉は想像しにくいですが、例えば自分だけメルマガの割引クーポンが配信されていないことを知ってその商品を買い控える、みたいな行動を引き起こしていた場合は①の条件に反している状態になります。
②は処置内容を明確にすべき、という条件です。例えばメルマガだけではなくダイレクトメールも送られていた場合、その効果はメルマガによる効果はダイレクトメールによる効果かわからなくなってしまいます。
識別可能条件
平均処置効果を観測可能な値から推定するための条件が2つあります。それが正値性と独立性です。
正値性
処置を受ける確率(具体例をあげるとメルマガが送付される確率)が以下のようであることを正値性と呼びます。
$0 < P(Z = 1) < 1$
当然と言えば当然ですが、処置をされる側に割り当てられる確率が0%または100%であれば当然推定はできません。
独立性
処置を受けるか受けないなかが結果{$Y_{i}(1),Y_{i}(0)$}に依存しないことを{$Y_{i}(1),Y_{i}(0)$}と$Z$は独立であるといい、以下のように記載します。
{$Y(1),Y(0)$}$⊥Z$
現実の世界でそのままこの条件が満たされるのはかなりレアケースです。例えばメルマガ送付の例をとっても普通は効果の高そうな人に絞って送付を行います。このようなことが行われている時点で既に独立性は満たしていないことになります。
WEBの世界でよく実施されているA/Bテストはこの条件を満たすために行っています。施策の対象者を完全にランダムにすることで独立性を満たしています。
NEXT
次回以降より進んだ内容をまとめていきます