はじめに
この記事は岩波データサイエンスVOL.3の内容を自分の観点でまとめたメモです。ぼかして書いている(すでに熟知している人でないと理解できないように書いている)つもりではありますが、著作者様から異議などありましたら早急に削除いたします。
相関≠因果
回帰係数と介入効果のズレ
1.逆(Y→X)の介入効果は回帰式の変形といっちしない(ズレがある)
3.合流点での選抜によるズレ
4.中間変数によるズレ
kaggleでは特徴量を足しまくるのでほぼこれが発生して因果効果など図ることができないように思われる、、、
バックドア基準のポイント
1.上流からの要因を遮断する
2/3 合流点・中間点を加えない
バックドア基準
所感
- ほぼ理解できたし面白かった。初心者にもわかりやすい。kaggleの予測とは目的がまるで違うので、今のところ因果推論の知識を活用するシーンがうまく思い浮かばない。
- 画像に文字を書き込んでしまうと後々修正がめんどくさいような気もするが、、