これはなに
ビジネスアナリティクスは割と一般化が難しい分野だ(と思っている)が、仕事をやっている中でなんとなく要諦みたいなものを言語化してみる試み。
気が向いたら(というかなにかに気づいたら)書き溜めてみようと思っているが、本当に続くかは不明。
特定の事象が発生する確率(頻度)を分解して理解する
SaaSにおけるChurn rateや特定機能の利用率など、分析においてターゲットとなる数字(KPIと呼んでもよい)は何らか無次元化された確率であることが多い。
この確率が発生するメカニズムや背景を数字をもって理解し、どのようにすれば上げられるか(下げられるか)を考えることが、分析によってビジネスの意思決定を行うということに対応する。
このような確率を直接的に理解するときには、何らかの直感的な構成要素(属性)で分解していくのが王道パターンと言える。
これを理解したい事象$A$が発生する確率$P(A)$と、構成要素$x$が占める比率$P(x)$を用いると以下のように表される。
P(A)=\sum _x P(A|x)P(x)
ただし、$\sum_x P(x)=1$を満たす。
この右辺に存在する$P(A|x)$と$P(x)$の関係性がビジネス仮説に対応 し、どのような施策を打つべきか、何を目指して戦略を立てるべきかのヒントとなる。
以上を機能Aの利用率を業種別に分解して理解する場合を例にして具体的に書き下すと、以下の通り。
\begin{eqnarray}
機能A利用率&=&\left(小売の機能A利用率\times 小売の比率\right)+\left(建設の機能利用率\times 建設の比率\right)+\cdots\\
&=&\sum _{業種X} \left( 業種Xの機能A利用率\times 業種Xの比率\right)
\end{eqnarray}
この分解をもとに、例えば全体に占める比率が大きいが、機能A利用率が低い業種に着目すれば、その業種の利用率を上げることができないかを考えるのが施策に落とし込む、ということである。
この分解に於いては、どのような構成要素(属性)$x$を選択するかが肝であり、分析官のセンスと経験が問われるところといえる。
この構成要素選択の基準は経験上このようなものが大事。
- MECEな分解になっている(必須条件) $\because \sum_x P(x)=1$
- 必ずいずれかの業種に所属し、被りがないとする
- 事象Aの発生確率の高低を説明する仮説が立つ
- 特定の業種は他に比べて機能A利用率が高いのではないか
- 分解結果$P(x)$に極端に小さな部分がない
- 極端に少ない業種がいたらその他とかにまとめればいい
- 分解結果$P(A|x)$が$x$ごとに大小の差が大きい
- これは分析して確かめる
必ずしも一つの要素で分解する必要は無く、和がネストされることも大いにあるが、あまり複雑にしすぎると理解が困難になることに注意。
アンチパターン
特定の事象が発生する確率の分解でなく、特定の事象が発生している中で、どのような構成要素が多いのか、と分解してしまう。
これは上との対比では、$P(A)$を理解するために本来算出すべき$P(A|x)$ではなく、$P(x|A)$を算出している例に該当し、ここへ$P(A)$の分解からたどり着くのは困難。
$A$の事象を理解したいのに$A$の事後確率を算出しており、論理的な考察にはたどり着かない。
機能Aの例では、機能Aを利用した事業者全体に占める業種の割合を算出することに対応。
機能Aを利用している事業者のうち、大半が業種Yだったとしても、対象事業者の大半が業種Yだったとしたら何の示唆も生まないよね、という感じ。