1
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

マーケットバスケット分析(Market Basket Analysis)

Last updated at Posted at 2020-05-05

「マーケットバスケット分析」の概要

  • 機械学習の、教師なし学習に使われる手法。
  • Aを買う人にはBも売れる」というような関連性(アソシエーションルール:Association Rule)を分析する。

使う指標

  • 支持度(support)
  • 確信度(confidence)
  • リフト値(lift)

↓の例で、「Aを買う人は、Bも一緒に買う?」という問題を考える

購入パターン
全購入データ 1,000
Aが買われた回数 800
Bが買われた回数 600
A・Bが同時に買われた回数 300

支持度(support)

  • 全ての購入データのうち、A・Bが同時に買われた割合。
  • 相対的な値のため、この数字のみでは一概に判断はできない。
  • 一般に支持度が小さいルールは有用性も低いことが多い。(=足切り基準として使われたりする)
\frac{300}{1000} = 0.3

※「AかつB」というルールのみでなく、「A」という商品の支持度を計算することもある。

確信度(confidence)

  • Aが購入されたデータのうち、A・Bが同時に買われた割合。
  • 確信度が高いと商品間の併売が見込めるため、高い商品の中からオファー商品を決定する、といったように使われる。
  • ただし、コレも絶対値だけでは一概に判断できないため、↓のリフト値も併せて見る必要あり。
\frac{300}{800} = 0.375

※「Bが購入されたデータのうち、A・Bが同時に買われた割合」は、異なる結果となる

\frac{300}{600} = 0.5

リフト値(lift)

  • 「全ての購入データのうち、Bが買われた割合」と「Aが購入されたデータのうち、A・Bが同時に買われた割合」の割合。
    • =確信度(confidence)/(商品Bの)支持度(support)
  • 1.0より大きい = 「全体のうちBが買われる割合 < Aが買われたうちBが買われる割合」 = 併売しやすい商品と言えそう
  • 1.0より小さい = 「全体のうちBが買われる割合 > Aが買われたうちBが買われる割合」 = 併売しやすい商品と言えなさそう
\frac{ \dfrac{300}{800} }{ \dfrac{600}{1000} } = 0.625

この例の場合、「Aを買う人にはBも売れる」とは言えなさそう

1
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?