背景
- 自然実験(準実験)の手法のうち、特に時系列変化に着目した差分の差分法と合成コントロール法に入門したい
- 自然実験とは:RCTが困難な状況において、 RCTがされたような状況を分析で作り出すことによって因果を推定する方法
概要
- データ
- 論文: Minimum Wages and Employment: A Case Study of the Fast-Food Industry in New Jersey and Pennsylvania
- ダウンロード元
- ※原論文との結果の一致は確かめていない点ご了承ください
- 設計
- 目的変数:雇用者数
- 施策開始前後の雇用者数がそれぞれ得られている
- 介入変数:最低賃金の値上げの有無(NewJerseyで実施、それ以外の地域では未実施)
- 目的変数:雇用者数
差分の差分法
手法
- 仮定
- 平行トレンド仮定
- 介入がなかった場合の推移は、実際の介入有無によらず変化の推移は同じ
- 共通ショック仮定
- 未観測の交絡因子はなく、交絡因子はモデルに加味されている
- 平行トレンド仮定
- モデル
y = \beta_0 + \beta_1 \text{group} + \beta_2 \text{post_treatment} + \beta_3 (\text{group} \times \text{post_treatment}) + \alpha X + \epsilon
- $\beta_0$: バイアス
- $\beta_1$:グループ(介入有無)間の差異
- $\beta_2$:介入前後の時系列の変化
- $\beta_3$:介入による効果
- $\epsilon$:誤差項
- $\alpha$: 店舗の特徴の係数
- $X$: 店舗の特徴
- チェーン店かどうか
- 会社直営かフランチャイズか
結果
- 全雇用者/フルタイム/パートタイム/管理職の雇用者数の推移と、上記の差分の差分法によって得られた$\beta_3$を示している
- 全雇用者で見ると、店舗のN数が少ないこともあり有意差はなく、最低賃金の上昇が雇用を減少させるとはいえない
- フルタイムで見ると、最低賃金の上昇によって雇用が増加しており、有意水準5%で有意となっており、最低賃金の上昇はむしろ雇用を増加させたといえる
- パートタイム/管理職では有意差はなく、最低賃金の上昇が雇用に影響するとは言い切れない
| employee_type | avrage_number_before_treatment in NJ | avrage_number_after_treatment in NJ | difference_in_differences (by regression) | p_value |
|---|---|---|---|---|
| empall | 293.47 | 294.43 | 24.21 | 0.28 |
| empft | 75.58 | 81.54 | 32.21 | 0.03 |
| emppt | 184.52 | 178.98 | -7.42 | 0.69 |
| nmgrs | 33.37 | 33.92 | -0.58 | 0.77 |
合成コントロール法
手法
- 仮定
- 線形加法性:介入がなかった場合の潜在的結果変数が、コントロール群ユニットの線形結合で表現できる
- 類似性の仮定:介入あり群の特徴ベクトルが、介入なし群の特徴ベクトルの凸包に含まれる
- モデル
Y_{0t} = \sum_{i=1}^{N} w_i Y_{it} + \epsilon_{t}
-
$Y_{it}$: 時点tにおけるiのアウトカム変数
- $i=0$: 処置群
- $i=1,...,N$: 対照群
-
$w_i$: 対照群iの重み
-
$\epsilon_t$: 誤差項
-
今回のデータでは、処置群が複数存在する
-
理想的には、この処置群それぞれに対して、対照群の重み付き平均を生成する
-
ただ、331店舗もあり、ここに対して毎回対照群を生成しているとかなり時間がかかるため、今回は代替手段として、処置群の平均を1店舗とみなし、そこに対する対照群を生成する
- DIDでは考慮していた、チェーン店や会社経営かの情報は考慮しない(特徴ベクトルとして考慮することは可能だが今回は省略)
結果
- 全体/フルタイムでは、最低賃金の上昇は雇用者数に正の影響を与えていそう
| employee_type | avg_before_t in NJ | avg_before_t sc | avg_after_t in NJ | avg_after_t sc | causal_effect (by SC) |
|---|---|---|---|---|---|
| empall | 293.84 | 294.04 | 294.78 | 289.12 | 5.66 |
| empft | 75.74 | 75.97 | 81.75 | 70.42 | 11.33 |
| emppt | 184.71 | 184.76 | 179.09 | 192.86 | -13.76 |
| nmgrs | 33.38 | 33.82 | 33.93 | 35.52 | -1.59 |
まとめ
- DID・SCともに解釈としてはほとんど一致する結果となった
- DID:クイックな検証、大規模な実験結果の初期分析、短期的な効果測定に適していそう
- SC:長期的なトレンドを持つデータ、長期間の政策効果の評価、非分析者への視覚的説明に適している
- GSCM(generalized synthetic control method)のような前提条件を緩和した方法もある
