2
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【因果推論】反実仮想モデル5選:「もしも」を統計的に推定する手法の比較

Posted at

はじめに

データ分析の現場では、「もし施策を実施しなかったら、どうなっていたか?」という問いに答える必要があります。しかし、実際に施策を受けた人が「施策を受けなかった場合」の姿を観測することはできません。

反実仮想モデルは、この観測できない「もしも」の世界を統計的に推定するアプローチの総称です。本記事では、代表的な5つの手法について、それぞれの考え方と適用場面を解説します。

反実仮想モデルの基本的な考え方

反実仮想モデルでは、観測できない「もし施策を受けなかった場合の処置群」の姿を推定します。これを「反実仮想」と呼びます。

各手法は、異なるロジックでこの反実仮想を推定します。以下、5つの代表的な手法を見ていきましょう。

各手法の詳細解説

1. 差の差分法 (DID: Difference-in-Differences)

反実仮想の作り方

差の差分法では、「施策がなかった場合、処置群はコントロール群と同じトレンドで推移したはずだ」と仮定します。この仮定を「平行トレンド仮定」と呼びます。

手法の概要

コントロール群の施策前後の変化量を計算し、それを処置群の施策前の値に足し合わせることで反実仮想を作ります。

具体的には、以下のように計算します。

反実仮想 = 処置群(施策前)+ コントロール群(施策後)- コントロール群(施策前)

適用場面

処置群・コントロール群ともに複数のデータポイントが存在し、施策前のトレンドが平行である場合に適しています。例えば、複数の店舗で新しいマーケティング施策を一部店舗にのみ導入した場合などです。

メリットと注意点

メリット

  • 比較的シンプルで理解しやすい
  • 時間的な変化を考慮できる

注意点

  • 平行トレンド仮定が成立しない場合、推定が不正確になる
  • 施策前のデータで両群のトレンドを確認する必要がある

2. 合成コントロール法 (SCM: Synthetic Control Method)

反実仮想の作り方

複数のコントロール群を最適に重み付けすることで、処置群と瓜二つの動きをする「合成コントロール」を作成します。

手法の概要

施策前のデータを使って、処置群と最も似た動きをする合成コントロールを作ります。処置後の「処置群」と「合成コントロール」の差が施策の効果となります。

重み付けは、施策前の期間において処置群の動きを最もよく再現できるように最適化されます。

適用場面

処置対象が1つで、比較対象となるコントロール群が複数ある場合に非常に強力です。例えば、特定の国や州で政策を導入した場合の効果測定などに用いられます。

メリットと注意点

メリット

  • 処置群が1つしかない状況でも適用可能
  • 複数のコントロール群の情報を統合できる

注意点

  • 十分な数のコントロール群が必要
  • 施策後の外部ショックに弱い

3. 回帰不連続デザイン (RDD: Regression Discontinuity Design)

反実仮想の作り方

ある基準(しきい値)のギリギリ上と下では、本質的な違いがほとんどないと考えます。例えば、合格点ギリギリで合格した人と不合格だった人は、能力的にはほぼ同じで、その差は偶然によるものです。

手法の概要

しきい値の前後で施策の有無が明確に分かれる状況を利用します。しきい値のすぐ上(施策を受けた人)とすぐ下(施策を受けなかった人)を比較することで、反実仮想を推定します。

適用場面

奨学金の給付基準(所得○○円以下)、入試の合格ライン(合格点○○点以上)など、明確なルールで施策が割り当てられている場合に適しています。

メリットと注意点

メリット

  • しきい値付近では準実験的な状況が作れる
  • 因果推論の信頼性が高い

注意点

  • しきい値付近のデータしか使えない
  • しきい値の操作が可能な場合は適用できない

4. 傾向スコア・マッチング (PSM: Propensity Score Matching)

反実仮想の作り方

処置群とほぼ同じ条件を持つコントロール群の人を見つければ、それが反実仮想になるという考え方です。

手法の概要

年齢、性別、所得などの共変量から「その人が処置を受ける確率」を計算します。これを傾向スコアと呼びます。処置群の各個人について、傾向スコアが最も近い人をコントロール群から探し出し、ペアを作って比較します。

適用場面

ランダム化比較試験(RCT)はできないが、処置群とコントロール群の多様な背景データが取得できている場合に用いられます。医療研究やマーケティング分野でよく使われます。

メリットと注意点

メリット

  • 観測できる共変量のバイアスを調整できる
  • 実装が比較的容易

注意点

  • 観測できない変数のバイアスには対処できない
  • 適切なマッチング相手が見つからない場合がある

5. 操作変数法 (IV: Instrumental Variables)

反実仮想の作り方

直接比較が難しい場合に、第三の要因(操作変数)を使って処置の効果だけを間接的に抽出します。

手法の概要

処置と結果の両方に影響を与える要因(交絡因子)があると、正確な効果が測れません。そこで、「処置には影響を与えるが、結果には直接影響しない」という操作変数を見つけ、それを利用して因果効果を推定します。

操作変数は以下の条件を満たす必要があります。

  • 関連性:処置に影響を与える
  • 除外制約:結果には直接影響を与えない
  • 外生性:交絡因子と相関しない

適用場面

他の手法では対処できない隠れたバイアスに対応する必要がある場合に用いられます。教育の収益率分析や、医療における治療効果の推定などで活用されています。

メリットと注意点

メリット

  • 観測できない交絡因子にも対処できる
  • 因果推論の信頼性を高められる

注意点

  • 適切な操作変数を見つけるのが難しい
  • より高度な統計的知識が必要

手法選択のガイドライン

状況に応じて、適切な手法を選択することが重要です。以下の表を参考にしてください。

手法 処置対象の数 必要なデータ 主な仮定 適用難易度
DID 複数 施策前後の時系列データ 平行トレンド仮定 ★☆☆
SCM 1つ 複数のコントロール群の時系列データ 施策前の類似性 ★★☆
RDD 複数 しきい値付近の密なデータ しきい値付近の連続性 ★★☆
PSM 複数 豊富な共変量データ 条件付き独立性 ★★☆
IV 複数 適切な操作変数 操作変数の妥当性 ★★★

選択のポイントをまとめると、次のようになります。

  • 施策前後のデータがあり、トレンドが似ている → DID
  • 処置対象が1つで、複数のコントロール群がある → SCM
  • 明確なしきい値で施策が決まる → RDD
  • 豊富な背景データがある → PSM
  • 隠れたバイアスが懸念される → IV

まとめ

本記事では、反実仮想モデルの代表的な5つの手法を解説しました。

それぞれの手法には独自の強みと限界があります。データの性質や分析の目的に応じて、適切な手法を選択することが重要です。実務では、複数の手法を組み合わせて頑健性を確認することも有効でしょう。

因果推論の手法は進化し続けており、これらの基本的な手法を理解することで、より高度な分析手法への道も開けてきます。

2
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?