はじめに
みなさん。因果、推論していますか?
今、自分が抱えている課題を解決するために色々調べ物をしていると、以下のようなキーワードが出てきました。
- 因果分析(本記事では 因果推論+因果探索 を指して因果分析という言葉を使います。)
- ベイジアンネットワーク
知らないことが多かったため、整理を含めて本記事を書きました!
この記事を見ると分かること/分からないこと
分かること
概念的な話がメインです。
- 因果って何
- 因果と相関の違い
- 因果分析って何が嬉しいの?
分からないこと
具体的な話はしません。(書くとしたら別で書きます!)
- 因果分析の方法/実装
前提
因果と相関の違い
因果関係、相関関係、それぞれよく聞く言葉で似てます。
相関関係:「一方(AorB)が変化したときに他方(BorA)も変化する」ときに、「AとBに相関関係がある」
因果関係:「Aを変化させたとき、Bも変化する」ときに、「A→Bの因果関係がある」
相関があっても因果はないこともあります。
相関はあるけど因果はない例
言葉だけだと分かりにくいので具体例を、、、。
- 逆の因果
- 交番がたくさんある区域は犯罪件数が多い!(相関がある)
- 仮説:交番を作ると犯罪が増える。(交番の増設→犯罪の増加)
- 実際:犯罪が多い区域だから交番を増やした。(犯罪の増加→交番の増設)
- 2つの値「交番の増設、犯罪の増加」は仮説とは逆の因果が存在していた。
- 交番がたくさんある区域は犯罪件数が多い!(相関がある)
- 共通の要因(C→A C→B)
#因果推論/因果探索
シチュエーション
例として「仕事への熱心さ」「研修の受講」「仕事の成果」の関係をあげました。
例では左図のように、研修受講は仕事の成果に依存していないことにしましたが、実際には右図のように多少の影響があると思います。
この3因子の関係を例に、因果推論と探索を考えていきます。
因果推論
因果推論は「因果の大きさ」を推定します。
「仕事の成果を上げたい!」と考えたときに、仕事の成果にはいろいろな因子から影響を受けていそうです。
研修を受講した方とそうでない方を比べたときに、仕事への熱心さに偏りがあるため、
仕事の熱心さの影響が強いのか、研修受講の影響が強いのか簡単には分かりません。
研修受講だけでどの程度仕事の成果が伸びるのか、因果推論を行うと因果の大きさを推定することができます。
因果探索
因果探索は「因果関係」を明らかにします。
上記の因果推論は図示したような因果関係を前提に考えていましたが、本当に因果関係はあるのでしょうか?
もっと大規模な大量の設問があるアンケートの分析などをする場合は、因果関係はとても難しいです、、、。
因果探索を行うと、どのような因果関係があるのかを明らかにできます。
おわりに
本当にさわりのさわりだけ書いたつもりなんですが長くなってしまいました。
この先、因果分析について 考え方→具体的な実装 の記事を書ければと思っています!