1. はじめに
マーケティングの世界での用語の一つに、顧客生涯価値(LTV, Life Time Value の略) という概念が存在します。これは、「あるお客さんが企業に対し、生涯でどれくらいお金を支払ってくれそうか」を示したものになります。限られた経営資源を有効活用したい企業にとっては、この顧客生涯価値は非常に重要な値となります。
さてこの値はもちろん未知なので、知りたい場合は推定を行う必要があります。そこで、今回の記事の目的はこの推定に役立つ統計モデルを紹介することです。なお、ここで紹介するモデルは少なくとも私の知る限り、オリジナルのモデルとなっています。1
また、今回紹介するモデルは簡単化のため、「いくら買うか」という部分までは考えず、「買うか買わないのか」という意思決定に絞って提案を行うことにします。「LTVの推定のためのモデルを作るといっているのに、そんな単純化が許されるのか」と思われる方もいらっしゃるとは思いますが、実は「いくら買うか」をモデリングするのは後付けで簡単に拡張できます。したがって今回についてはご容赦ください。
2. BTYDモデル
さてこのモデルを紹介するにあたっては、現在までに広く利用されているモデルについて紹介する必要があります。顧客生涯価値の推定を行う上で最も有名なのは、 BTYD(Buy Till You Die)モデル というものになります。実はこのBTYDモデルには多くの派生モデルがあるため、必ずしも一言で紹介できるものではありません。しかし概して、以下のような構造を仮定するモデルとなります。
- 顧客にはデータでは直接観察されない「生存状態」と「死亡状態」の2つが存在する。全顧客は最初の観測時点において生存状態だと仮定される。
- 生存している限りは、毎日 $p$ の確率で購買を行う。
- 生存状態にある消費者は毎日 $s$ の確率で死亡状態に移行する。死亡状態に移行してしまった消費者はもう二度と購買を実施せず、二度と生存状態に復帰することはない。
これは図示すると以下のようなイメージとなります。
BTYDモデルはこのように非常にシンプルな構造を前提としており、推定も容易です。しかし、この顧客の状態のシンプルさ故に、『顧客の一時的離脱を捉えることができない』という欠点 があります。
例えば、1月から3月まで週1のペースで購入をしていた顧客が、急に4月から6月まで一度も購入せず、また7月から同じように購入を初めたとします。このとき、BTYDモデルを用いて推定を行うと、「この顧客は4月から6月までは生存状態だったけど、たまたま購入をしなかっただけ」と解釈することになります。もちろんその解釈は必ずしも誤りとは言えませんが、直感的には「4月から6月の期間はこの消費者は一時的に離脱して(飽きて)いた」と考えたくなります。
ではどうすれば、この一時的な離脱を捉えられるようになるのでしょうか。それを可能にするのが、私がここで提案するモデルです。
3. 提案モデル
BTYDモデルにおける問題点は、状態が生存状態と死亡状態の2つしかないことでした。そこで、このモデルを拡張し、**「一時的な飽き(離脱)状態」(以下飽き状態)**を新たな状態として追加することにします。図で示すと以下のようなイメージになります。
もう少し厳密に数学表現すると以下のようになります。
- 顧客にはデータでは直接観察されない「生存状態」、「死亡状態」に加え「飽き状態」の2つが存在する。
- 全顧客は最初の観測時点において「生存状態」か「飽き状態」のいずれかあり、それぞれの確率を $\pi, 1-\pi$ と表現する。。
- 生存状態であれば、毎日 $p$ の確率で購買を行うが、それ以外の状態では購買は発生しない。
- 生存状態にある顧客は毎日 $s_1$ の確率で飽き状態、 $s_2$ の確率で死亡状態に移行する。飽き状態の顧客は確率 $r$ の確率で生存状態に復帰するが、死亡状態の顧客は生存状態にも飽き状態にも二度と復帰することはない。
当たり前ですが、こうすれば不自然な空白を生存状態だとみなす必要がなくなるため、より自然なモデリングを行うことができるようになります。
しかし、こうしたことによってある問題が発生します。それは、あり得る状態の組み合わせが爆発的に増えてしまったことです。BTYDモデルでは、基本的にはいつも生存状態であり、「最後の購買日」から「最終観測地点」までの間にのみ死亡状態があり得ます。一方提案モデルでは、最後の購買日までの期間においても、生存状態と飽き状態の両方があり得てしまいます。このことは、顧客の状態が何状態か「見える」のであれば問題ありませんが、顧客の状態を直接聞いて観測することができない我々の状況では、難しい問題となってしまいます。
そんな状況において、実用的なレベルできちんと推定を行うことが果たしてできるのか?と問いかけたくなるものですが、きちんと推定することができるんです。次回以降、隠れマルコフモデルに Baum and Welch アルゴリズム(EMアルゴリズムの一種)を応用し、この推定がどうなされるのか解説します。
-
もちろん近いモデルはあります。かなり近いところでいうと Ma and Büschken (2010) で、他にも近いところでいうと日本の阿部誠先生の執筆されたこの研究が近いです。 ↩