私たちは皆、オルタナティブ・シナリオ(実際とは異なる選択を取るとどうなっていたか)を知りたい思うことがあります。例えば、大学で別の専攻を選んでいたら給料はどうなっていただろう?国家間の争いがなかったら世界はどうなっていただろう?または、現実的な質問として、あと5分早く家を出ていたら電車に乗り遅れただろうか、といったシナリオが挙げられます。
企業も当然、このような質問に関心があります。例えば、スポーツジムの経営者が、既存顧客に割引を適用した場合、その年間契約を更新する可能性が高いかどうか知りたいと思うかもしれません。携帯電話メーカーは、自社の主力製品の価格を上げることが利益向上につながるかどうかを知りたいと思うでしょう。
これらの質問はすべて、ある行動や「介入」が、ある興味ある結果に及ぼす因果的な影響に関するものです。このような問いにデータで答えるための科学的学問を「因果推論(Causal Inference: CI)」と呼びます。
→ Technical Ebook: An Introduction to Causal Inference
CIは、古典的な機械学習(ML)よりも理解するのが困難であることは間違いありません。より制約の多い仮説を必要とし、異なるモデリング技術を使用します。標準的なMLツールボックスを用いて観測データ(すなわち、介入変数が研究者によって制御されていないデータで、通常データ実務者が遭遇するもの)に対して因果効果を推論しようとすると、予測不可能な結果で誤解を招く可能性があります。
CIを紹介するために、最も一般的なアプリケーションの一つである「アップリフトモデリング」を例に説明します。アップリフトモデリングはマーケティングの分野でよく用いられる手法であり、古典的なチャーンモデリングの改良版とみなされています。
例: チャーンモデリング
全米に複数のジムを持つ大手フィットネス会社を例にして考えてみましょう。利益を最大化するためには、新規顧客を開拓するだけでなく、既存顧客にメンバーシップを毎年更新してもらう必要があります。会員更新を最大化するために、同社のデータサイエンティストは、過去のデータを使って、様々な顧客特性(年齢、ジムのチェックイン履歴など)を関数として、顧客の解約目標を予測するMLモデルを学習させます。次に、このモデルを使って既存顧客をスコアリングし、一人ひとりの解約する確率を求めます。これらのスコアは、どの顧客がメンバーシップ更新のインセンティブ(動機付け)として割引を受けとるかを決定するための基礎となります。
今説明したのは、典型的なチャーン(解約)モデルのユースケースです。このチャーンモデルは、顧客が解約するリスクがあるかどうかを予測するのに役立ちますが、その顧客が割引に対して好意的な反応を示すかどうかのスコアは得ることはできません。後者は、アップリフトモデリングの仕事になります。
もっといい方法があるはず: アップリフトモデリング
顧客一人ひとりがどのような反応を示すかを知るためには、理想としては、割引(介入)を「適用した場合」と「適用しない場合」の顧客の会員更新状況を知る必要があります。つまり、一人一人の顧客について、2つの結果を知る必要があります。この2つの組み合わせで、4つの顧客タイプが生まれます。
- Persuadables(説得可能): この顧客は、割引を受ければ更新し、しなければ解約される。
- Sure Things(確実): この顧客は、割引を受けても受けなくても更新される。
- Lost Causes(見込みなし): これらの顧客は、割引を受けても受けなくても解約する。
- Sleeping Dogs(あまのじゃく): これらの顧客は、割引を受けると解約し、受けていない場合は更新する。
理想の世界では、企業は「Persuadables」顧客だけをターゲットにするでしょう。しかし、残念なことに、誰もが同時に介入され、同時に介入されないということはあり得ません。これらの潜在的な結果のうち、1つだけが観測可能です。その他の実際には観測されないものは反実仮想(counterfactual)となります。
反実仮想が観測できないことは、因果推論の基本的な問題として知られています。この問題は因果推論の分野ではよくあることです。ありがたいことに、データに関するいくつかの強力な、しかしほとんど検証不可能な仮説の下では、この問題を回避することができ、顧客のアップリフトを予測することができます。
アップリフト=更新確率(割引あり)-更新確率(割引なし)
顧客のアップリフトは、顧客更新の確率に対する介入の効果として定義されます。アップリフトモデルとは、このアップリフトを予測するために学習させることができるあらゆるモデルのことで、多くのモデルが存在します。優れたアップリフトモデルでは、ある顧客が正のアップリフトを持つと予測される場合、その介入がその顧客のメンバーシップ更新の可能性に正の影響を与えると期待されます。その顧客は、"Persuadable "である可能性が高くなります。
注意点としては、モデルの質はデータの質によるということです。満足のいかない仮説は、予測に誤差を生じさせ、ビジネスの意思決定者を誤導してしまう可能性があります。
その重要な仮説とは?
ここでは、仮説の詳細については説明しませんが、これらの仮説やCI全般について詳しく知りたい場合は、こちらのE-bookをご参照ください。アップリフトモデルをトレーニングするために、企業は、ある顧客に介入を割り当て、他の顧客は未介入のままにするキャンペーンを実施する必要があります。仮説は、そのキャンペーンでどのように介入を顧客に割り当てるべきかを規定します。
そのうちの一つは、どの顧客が割引を受けるか受けないかを判断するために使用され(例えば、年齢、顧客の購入履歴)、更新に影響を与える要因は、アップリフトモデルで使用されなければならないことを前提としています。例えば、ジムで働くスタッフの裁量である顧客に対して割引が行われた場合です。なぜなら、スタッフはデータに記録されていない顧客に関する情報を持っている可能性があるからです。また、スタッフがモチベーションの高そうなジム利用者にしか割引を与えなかった場合、そのようなモチベーションの高い顧客はメンバーシップを更新する可能性も高いため、アップリフトモデルは割引の効果を誇張することになります。このように、アップリフトの推定には正のバイアスがかかっているのです。
もう一つのシナリオは、あるタイプの顧客(観察可能な特徴によって測定)のアップリフトを予測するには、その特手のタイプの顧客はキャンペーン中に介入を受ける機会がなければならないということです。例えば、長年ジムを愛用している顧客には割引が適用されなかったとすると、アップリフトモデルはその特定のグループについて信頼できる予測を行うことはできません。幸いなことに、この仮説は検証可能であり、常に介入を受けたグループと全く受けなかったグループのどちらかを検出することができます。これらの潜在的なバイアスや推定の問題をすべて回避する最善の方法は、可能な限り介入の割り当てをランダムにすることです。
因果関係の推論についてさらに詳しく
本書では、因果推論の概要、通常のMLによる因果推論の危険性、アップリフトモデリングに関する知見などを紹介しています。
原文: Motivation for Causal Inference