- 参考にしたもの
「マーケットバスケット分析」の概要
- 機械学習の、教師なし学習に使われる手法。
- 「Aを買う人にはBも売れる」というような関連性(アソシエーションルール:Association Rule)を分析する。
使う指標
- 支持度(support)
- 確信度(confidence)
- リフト値(lift)
↓の例で、「Aを買う人は、Bも一緒に買う?」という問題を考える
購入パターン | 数 |
---|---|
全購入データ | 1,000 |
Aが買われた回数 | 800 |
Bが買われた回数 | 600 |
A・Bが同時に買われた回数 | 300 |
支持度(support)
- 全ての購入データのうち、A・Bが同時に買われた割合。
- 相対的な値のため、この数字のみでは一概に判断はできない。
- 一般に支持度が小さいルールは有用性も低いことが多い。(=足切り基準として使われたりする)
\frac{300}{1000} = 0.3
※「AかつB」というルールのみでなく、「A」という商品の支持度を計算することもある。
確信度(confidence)
- Aが購入されたデータのうち、A・Bが同時に買われた割合。
- 確信度が高いと商品間の併売が見込めるため、高い商品の中からオファー商品を決定する、といったように使われる。
- ただし、コレも絶対値だけでは一概に判断できないため、↓のリフト値も併せて見る必要あり。
\frac{300}{800} = 0.375
※「Bが購入されたデータのうち、A・Bが同時に買われた割合」は、異なる結果となる
\frac{300}{600} = 0.5
リフト値(lift)
-
「全ての購入データのうち、Bが買われた割合」と「Aが購入されたデータのうち、A・Bが同時に買われた割合」の割合。
- =確信度(confidence)/(商品Bの)支持度(support)
- 1.0より大きい = 「全体のうちBが買われる割合 < Aが買われたうちBが買われる割合」 = 併売しやすい商品と言えそう
- 1.0より小さい = 「全体のうちBが買われる割合 > Aが買われたうちBが買われる割合」 = 併売しやすい商品と言えなさそう
\frac{ \dfrac{300}{800} }{ \dfrac{600}{1000} } = 0.625
この例の場合、「Aを買う人にはBも売れる」とは言えなさそう