アソシエーション分析とは
某大手通販サイトの「この商品を買った人はこちらの商品も買っています!!」というように物事の関連性を調べる分析です。
分析を扱う際には、.basketという拡張子のファイルが必要になります。
今回はその.basketファイルをpythonから作るときのやり方を紹介したいと思います。
.basketファイルとは
- 一行に一回分の買い物(ひとまとまり)が入っており、それぞれが[,]で区切られています。
- 行の最後の項目は[,]がつきません。
python手順
今回は[[a,b,c],[c,d,e]]のように、リストの中にリストが入っている入れ子構造のものを.basketにしました。
- .basketファイルを作成したいディレクトリ(フォルダ)に移動します。
- 作成したいファイル名を下記コマンド1行目の(任意)に入力します。この際、拡張子は.basketにします。
- 私の場合は、上記のようにリストの入れ子構造になっているので、for文でリストを取り出し、リストごとに,をつけるのか、,をつけずに改行するのかを指定しています。
with open('(任意).basket', 'w', encoding = 'utf-8') as tb:
for tw in list:
if len(tw)>1: #空のリストがたまに含まれていたので、リストの長さが1以上のものだけ処理
a = ''
for i in tw:
a += '{},'.format(i)
a1 = a[:-1]+'\n'
tb.write(a1)
重要なのは[,]で区切ること、バスケットの最後の項目は[,]をつけず改行することです。