忙しい人向けの結論
・傾向スコアとは介入グループに割り振られる確率のこと
・マッチング法とは傾向スコアが似たもの同士をペアにして、効果検証を行う。ATTが推定される
・IPWとは平均をとる際に傾向スコアの逆数を重みとして利用しているもの。
・回帰分析、IPW、マッチング法で利用する分析方法で迷った際は全部使ってみる。
傾向スコアとは
・ある被験者が介入グループに割り振られる確率。
・介入変数を目的変数としたロジスティック回帰分析などで出力した確率がそのまま傾向スコアとなる。
・発想は介入グループと非介入グループで似た被験者を組み合わせていけば、外的な要因(バイアス)に左右されることなく介入の効果検証ができるというもの。傾向スコアがその似た度合いを示す。
・介入・非介入を決める際に何らかの基準や仕組みがあるとき、介入グループに入れられる確率(=傾向スコア)が近いもの同士は性質も似ていると考える発想でもある。
傾向スコアが似たもの同士でペアにして分析する=傾向スコアマッチング法
・傾向スコアが近いもの同士は似た性質があると考え、その似たもの同士をペアにすることで、バイアスを減らして、効果検証しようとする発想に基づく方法。
・注意点としてマッチングしなかったデータは捨てられる。
・推定される効果はATT(Average Treatment effect on Treated)。ATTとは介入グループに選ばれた人たち(Z=1)が、もし介入が行われなかった場合の効果量と介入が行われた場合の差の平均。ここで、非介入グループに割り振られた人たちは考えてないので、そこは混同しないこと。P(X)は傾向スコア。Yは介入の効果量。
\tau_{ATT} = \mathbb{E}(\mathbb{E}[Y|P(X),Z = 1] - \mathbb{E}[Y|P(X),Z = 0]|Z = 1)
ATE(Average Treatment effect)を推定することもできる。ATEは介入グループと非介入グループの差の平均。
IPW(逆確率重みづけ)
アイデアは介入に割り振られる個体は、元々効果が出やすい個体が割り振られ、非介入に割り振られる個体は効果が小さいまたは出にくい個体が割り振られているので、傾向スコアの逆数を使って、効果量の重みを調整するという発想。逆数を利用すると介入グループに割り振られる個体は傾向スコアが高いため、介入グループの効果量は低い倍率で補正され、非介入グループはその逆なので、非介入グループの効果量は高い倍率で補正される。これにより、セレクションバイアスを軽減し本来の効果量$Y^{(1)} - Y^{(0)}$を発見する手法。
マッチング法と回帰分析とIPWの比較
回帰もマッチング法もIPWも共変量によるバイアスを取り除いて分析するという発想である点は同じ。ただし、それぞれを特徴が違うので、以下は比較してメリット・デメリットとなるものを羅列したもの。
・回帰分析は共変量が必要だが、マッチング法やIPWは共変量がなくても分析できる
・マッチング法やIPWでは傾向スコアが良いものかどうか検討する必要がある。検討する方法は、マッチング後のデータで、共変量のASAM(標準化後平均差)を確認し、傾向が似ているか判断する。
・マッチング法ではマッチングしなかったデータを捨てているため、恣意的になりやすい(マッチングの基準を緩くしたり、キツくしたりすることで結果を操作できる)。
・IPWだと特にデータを捨てる必要もなく、全データで分析できる。
・回帰分析はモデリングが必要。2乗の項などが存在する場合、これを入れずに分析するとOVBが発生する。一方で、マッチング法やIPWはモデリングが必要ないので楽。
とにかく全部やってみるのが正解かも。
参考文献
効果検証入門〜正しい比較のための因果推論/計量経済学の基礎