この記事の目的
・面白かった論文についての自分用のメモ
今回対象にする論文
Causal Inference With Interference and Noncompliance in Two-Stage Randomized Experiments.
ざっくりまとめ
因果推論の分野では、処置を受けるユニット同士がお互いに影響を与えないことを前提に実験を行うことが多いですが、なかなかうまくいくこと少ないです。特にマーケティングなどでは、住んでいるエリアや年齢・性別などの属性が近いほど、あるユニットの処置が別のユニットの結果に影響を及ぼすことがあります。
本論文では処置の割り当てを2段階でランダム化することで、平均直接効果とスピルオーバー効果をノンパラメトリックに識別する方法を提案しています。
「スピルオーバー効果」とは
本研究以外でもこの分野ではよくつかわれるスピルオーバー効果ですが、今回は以下の2つを推定対象にしています。
- 処置割り当てが処置の受領に与えるスピルオーバー効果
- 処置の受領が結果に与えるスピルオーバー効果
提案手法
ランダム化手法
N個のユニットをJ個のグループのいずれかのグループに所属しているとする。(グループjに所属するユニット数を$n_j$とする。)
- Step1:J個のグループを"処置を受けやすいグループ"と"処置を受けにくいグループ"に分ける
- Step2:各グループ内で決められた処置割合に従って、グループ内のユニットに処置の割り振りを決定
※ ただし、論文内では"処置を受けやすいグループ"、"処置を受けにくいグループ"それぞれのグループでの処置割合について特にどのように決めるか言及がない。
推定したい効果
今回推定したい方法は以下の4つ
割り当ての受け入れ | ポテンシャルアウトカム | |
---|---|---|
Direct Effect (直接効果) | ① | ③ |
SpillOver Effect (間接効果) | ② | ④ |
- 直接効果:各メカニズム内で処置群とコントロール群の差分を使って算出する。
- 間接効果:処置受領の差をメカニズム間で計算することで、処置群や対照群で行動やアウトカムにどういったユニット間の相互作用を及ぼしているかを計算する。
直接効果
割り当て自体による直接効果を各割り当てメカニズムごとに推定する
\begin{align}
DED_j(a) = \frac{1}{n_j} \sum_{i =1}^{n_j}DED_{ij}(a), \quad DED(a) = \frac{1}{N} \sum_{j=1}^{N}n_jDED_{j}(a) \\
DEY_j(a) = \frac{1}{n_j} \sum_{i =1}^{n_j}DEY_{ij}(a), \quad DEY(a) = \frac{1}{N} \sum_{j=1}^{N}n_j DEY_{j}(a)
\end{align}
$DED_{ij}(a)$、$DEY_{ij}(a)$はそれぞれ、個人レベルでの割り当て受領、アウトカムに対する直接効果を表す。
$DED_{ij}(a)$、$DEY_{ij}(a)$の詳細
DED_{ij}(a) = \overline{D}_{ij}(1, a) - \overline{D}_{ij}(0, a) \quad DEY_{ij}(a) = \overline{Y}_{ij}(1, a) - \overline{Y}_{ij}(0, a)
\begin{align}
\overline{D}_{ij}(z, a) = \sum_{z_{-i, j} \in Z_{-i, j}} D_{ij}(Z_{ij} = z, Z_{-i, j} = z_{-i, j}) \\
Pr(Z_{-i, j} = z_{-i, j} | Z_{ij} = z, A_j = a)
\end{align}
\begin{align}
\overline{Y}_{ij}(z, a) = \sum_{z_{-i, j} \in Z_{-i, j}} Y_{ij}(Z_{ij} = z, Z_{-i, j} = z_{-i, j}) \\
Pr(Z_{-i, j} = z_{-i, j} | Z_{ij} = z, A_j = a)
\end{align}
間接効果
同じグループ内でのスピルオーバー効果を推定する
\begin{align}
SED_j(z) = \frac{1}{n_j} \sum_{i =1}^{n_j} SED_{ij}(z), \quad SED(z) = \frac{1}{N} \sum_{j=1}^{N}n_j SED_{j}(z) \\
SEY_j(z) = \frac{1}{n_j} \sum_{i =1}^{n_j} SEY_{ij}(z), \quad SEY(z) = \frac{1}{N} \sum_{j=1}^{N}n_j SEY_{j}(z)
\end{align}
$SED_{ij}(z)$、$SEY_{ij}(z)$はそれぞれ、個人レベルでの割り当て受領、アウトカムに対するスピルオーバー効果を表す。
$SED_{ij}(z)$、$SEY_{ij}(z)$の詳細
SED_{ij}(z) = \overline{D}_{ij}(z, 1) - \overline{D}_{ij}(z, 0) \quad SEY_{ij}(z) = \overline{Y}_{ij}(z, 1) - \overline{Y}_{ij}(z, 0)
仮定のまとめ
- Assumption1:割り当て方法の設定
- Assumption2:ポテンシャルアウトカムや割り当ての受け入れの影響範囲の仮定 (直接効果、スピルオーバー効果の推定量の構築に必要)
- Assumption3:因果推論の一般的な仮定
- Assumption4:一般的な単調性の仮定 (LATEの仮定と類似したもの)
- Assumption5:割り当てに影響されない人への影響方法についての仮定 (ノンパラメトリック識別性のため必要)
- Assumption6:層別干渉の仮定 (ITTの分散の推定に必要)
仮定の詳細
仮定 1: 二段階ランダム化 (Two-Stage Randomization)
この仮定は、二段階ランダム化実験の設定において、まず各クラスターが処置割り当てメカニズムをランダムに割り当てられる。
Pr(\boldsymbol{A} = \boldsymbol{a}) = \frac{1}{
{}_JC_{J1}
}
また、各グループj内で割り当てる確率は割り当てメカニズムに沿って均等になるように設定
Pr(\boldsymbol{Z}_j = \boldsymbol{z} | A_j = a) = \frac{1}{
{}_{n_j}C_{n_{j1}}
}
仮定 2: 部分干渉 (Partial Interference)
ユニットの処置受け取りおよび結果は、同じクラスター内の他のユニットの処置割り当てによって影響を受けるが、異なるクラスターのユニットには影響を受けないと仮定。
Y_{ij} (z) = Y_{ij} (z') \quad and \quad D_{ij} (z) = D_{ij} (z') \quad \forall \boldsymbol{z}_j = \boldsymbol{z'}_j
ただし、$D_{ij} (z)$は、割り当て$z$が決まった時Jグループのユニットiがその割り当てをもとにプログラムを享受するかどうかを0か1で表す関数、$\boldsymbol{z}_jは\boldsymbol{z}$のグループjの中の一部のベクトルを指す。
仮定 3: 介入の除外制約 (Exclusion Restriction with Interference)
ポテンシャルアウトカムは、割り当て自体ではなく、割り当てを受領した場合にのみ影響を受ける。
Y_{ij}(z_j ; \boldsymbol{d}_j) = Y_{ij}(z'_j ; \boldsymbol{d}_j) \quad \forall z_j, z'_j, \boldsymbol{d}_j
仮定 4: 単調性 (Monotonicity with Interference)
割り当てを受けなかった場合にプログラムを享受する人は、少なくとも割り当てを受けた時は必ずプログラムを享受する。(非合理な判断をするひねくれものはいない、と仮定する)
D_{ij} (1, z_{-i,j}) \geq D_{ij} (0, z_{-i,j}) \quad \forall z_{-i, j} \in Z_{-i, j}
仮定 5: 非準拠下での制限された干渉 (Restricted Interference under Noncompliance)
ユニットがプログラムを享受するかどうかが自身の処置割り当てに影響されない場合、そのユニットのポテンシャルアウトカムもまた、他の人の処置の受け取りを通じて、自身の処置割り当てによって影響を受けない。
\forall i, j \quad D_{ij}(1, z_{-i, j}) = D_{ij}(0, z_{-i, j}) \quad \Rightarrow \quad Y_{ij}(D_j(1, z_{-i, j})) = Y_{ij}(D_j(0, z_{-i, j}))
割り当ての影響をグラフ化
仮定 6: 層別干渉 (Stratified Interference)
ユニットの処置効果がクラスター内の処置を受けたユニットの特定のメンバーではなく、処置を受けたユニットの総数に依存すると仮定します。
D_{ij} (1, z_{-i, j}) = D_{ij} (0, z_{-i, j}) \Rightarrow Y_{ij}(D_{j} (1, z_{-i, j})) = Y_{ij}(D_{j} (0, z_{-i, j}))
主な主張
Theorem 1:ITT効果の不偏推定量
不偏推定量が構築できる
- 直接効果 (処置効果)
- 割り当ての受け入れへの効果: $\hat{D}_{ED}(a) = \hat{D}(1, a) - \hat{D}(0, a)$
- ポテンシャルアウトカムへの効果:$\hat{D}_{EY}(a) = \hat{Y}(1, a) - \hat{Y}(0, a)$
- 間接効果 (スピルオーバー効果)
- 割り当ての受け入れへの効果: $\hat{S}_{ED}(z) = \hat{D}(z, 1) - \hat{D}(z, 0)$
- ポテンシャルアウトカムへの効果:$\hat{S}_{EY}(z) = \hat{Y}(z, 1) - \hat{Y}(z, 0)$
ただし、数式については以下の詳細を確認
数式詳細
\begin{align}
\hat{D}(z, a) = \frac{\frac{1}{N} \sum^J_{j = 1} n_j \hat{D}_j(z, a) I(A_j = a)}{\frac{1}{J}\sum^J_{j = 1} I(A_j = a)} \\
\hat{Y}(z, a) = \frac{\frac{1}{N} \sum^J_{j = 1} n_j \hat{Y}_j(z, a) I(A_j = a)}{\frac{1}{J}\sum^J_{j = 1} I(A_j = a)}
\end{align}
また、
\begin{align}
\hat{D}_j(z, a) = \frac{\sum_{i=1}^{n_j} D_{ij} I(Z_{ij} = z)}{\sum_{i=1}^{n_j} I(Z_{ij} = z} \\
\hat{Y}(z, a) = \frac{\frac{1}{N} \sum^J_{j = 1} n_j \hat{Y}_j(z, a) I(A_j = a)}{\frac{1}{J}\sum^J_{j = 1} I(A_j = a)}
\end{align}
応用事例
論文内では、インドにおける国家規模の健康保険制度である「Rastriya Swasthya Bima Yojana (RSBY)」についてそのプログラムの効果を評価しています。
このプログラムの目的は、貧困世帯が直面する医療費の負担の軽減、特に入院治療のための経済的保護を提供し、高額な医療費を払うことで貧困に陥ってしまうケースを防ぐことにあります。RSBYが貧困層の医療費負担を軽減し、健康状態を改善する効果があるかを評価したい、というのが今回の目的です。
ランダム化比較試験の設計
RSBYの効果を評価するためにインドのカルナータカ州の2つの地区でランダム化比較試験を実施しました。評価の対象は、以下の2つの条件を満たす、約11,089世帯です。
- 既存の保険に加入していない、RSBY対象外
- RSBY提携病院から25km以内に居住していること
この評価のランダム化デザインは、2段階の無作為化を特徴としています。
-
Step1:村レベルで無作為に選ばれた219の村を以下の2つのメカニズムに割り当て
- 「高い」処置割り当てメカニズム
- 「低い」処置割り当てメカニズム
-
Step2:各メカニズム別に世帯に対してランダムに処置を割り当て
- 「高い」処置割り当てメカニズム
- 処置群:80%の世帯
- コントロール群:20%の世帯
- 「低い」処置割り当てメカニズム
- 処置群:40%の世帯
- コントロール群:60%の世帯
- 「高い」処置割り当てメカニズム
ただし、処置群の世帯にはRSBYが基本的に無料で提供され、対照群の一部の世帯は政府価格でRSBYを購入することが可能です。
施策評価
評価方針
プログラムの効果を評価するためには、実際の処置受領の効果を推定するだけでなく、意図した処置効果(ITT効果)も評価しております。処置群の一部の世帯がRSBYに登録しない一方で、対照群の一部の世帯が登録する可能性あるためです。
評価上の問題(スピルオーバー効果と不遵守の問題)
スピルオーバー効果
ある世帯がRSBYに登録するかどうかが、他の世帯の処置割り当てによって影響を受ける可能性があることを指します。例えば、非公式な保険制度が正式な保険制度に代わることが考えられます。つまり、ある世帯のRSBY登録は、他の世帯の登録決定に影響を与える可能性があります。
不遵守の問題
処置群に割り当てられた世帯がRSBYに登録しない場合や、対照群に割り当てられた世帯がRSBYに登録する場合があります。このような不遵守が発生するのは、倫理的および物流上の理由から、研究者が被験者に実験プロトコルを強制できないためです。
結果
- 平均波及効果(SED):治療条件に世帯のより大きな割合を割り当てると、同じ村の別の世帯が RSBY に登録する可能性が高くなる
- 平均直接効果:
- 「低い割り当てメカニズム」: 人々は病院をより頻繁に訪れ、医療に多く費やす可能性がある
- 「高い割り当てメカニズム」:病院の混雑により、治療を受けた世帯の病院訪問減少の可能性がある
この論文の面白かったところ
・比較的簡単に空間的なスピルオーバー効果と直接効果を分解して推定できること
・(省略して説明したが)LATEと類似の効果も推定できること
・(省略して説明したが)回帰モデルを使って、回帰係数として上記の推定量を計算できること(よって推定量の分散も計算できる)
参考
元論文:https://www.tandfonline.com/doi/full/10.1080/01621459.2020.1775612