はじめに
2021年に購買実績があるものの2022年は何も購入していない顧客がいたとします。
これらの顧客に対して、継続して購買していただくためにアプローチをしたいのですが、そもそもそのような行動をする顧客を特定することができるでしょうか?
Oracle Analytics Cloud(OAC)のデータフローで抽出してみたいと思います。
わかりやすくするために単純なサンプルデータを準備しました。この中には、2021年に購買実績があり2022年にはない顧客がいます(太字にしました)。
顧客ID | 購入日 | 製品カテゴリ | 購入数量 | 購入金額 |
---|---|---|---|---|
10982 | 2021/1/1 | キウイ | 2 | 7200 |
16876 | 2021/1/2 | キウイ | 1 | 3600 |
29786 | 2021/1/3 | キウイ | 1 | 3600 |
29787 | 2021/1/4 | キウイ | 2 | 7200 |
27563 | 2021/1/5 | キウイ | 3 | 10800 |
29787 | 2022/1/6 | マンゴー | 3 | 360 |
27563 | 2022/1/7 | マンゴー | 2 | 480 |
28798 | 2022/1/8 | マンゴー | 3 | 360 |
13242 | 2022/1/9 | マンゴー | 1 | 240 |
00083 | 2022/1/10 | マンゴー | 2 | 480 |
このデータをExcelファイルとして保存して使用します。
OACにデータセットとして取り込む
OACにログインし、右上の「新規」ボタンをクリックします。
続いて「データセット」をクリックします。
「ここにデータ・ファイルをドロップするか、クリックして参照します」と表示されているエリアにサンプルのExcelファイルをドラッグ&ドロップします。(またはクリックしてファイルを選択します)
中身を確認し、「追加」ボタンをクリックします。
左上の「戻る」をクリックして、ホームに戻ります。
データフローを作成する
データセットの追加
「新規」をクリックし、「データ・フロー」を選択します。
先程追加したデータセットを選択し、「追加」ボタンをクリックします。
追加したデータセットの右側の「+」をクリックしてステップを追加します。
「フィルタ」ステップを追加します。
「+」をクリックしてフィルタの対象列を指定します。
「購入日」をクリックします。
直接入力するか、カレンダーコントロールを使用して「開始」を「2021/1/1」、「終了」を「2021/1/31」にします。
データが2021年1月だけにフィルタされました。
2つ目のデータセットを追加
「データの追加」をドラッグして最初に追加したデータセットの下にドロップします。
先程と同じデータセットを選択し「追加」をクリックします。
2つ目のデータセットにも、「フィルタ」ステップを追加します。
「購入日」に対してフィルタを設定します。
「開始」と「終了」は、それぞれ「2022/1/1」「2022/1/31」とします。
データセットを結合
上のフィルタの右側の「+」をクリックしてステップを追加します。
「結合」をクリックします。
下のフィルタの右側の「○」をクリックします。
次のようになります。
入力1の行の保持を初期値の「一致する行」から「すべての行」に変更します。
2021年1月にフィルタしたデータセットのすべての行(「顧客ID」から「購入金額」まで)が表示され、それに一致する2022年1月にフィルタされたデータセット(「顧客ID_1」から「購入金額_1」まで)が結合されます。
2021年1月に購入実績があるが2022年1月には購入実績がない顧客は、2022年のデータがないのですべての列でデータが空白となっています。
つまり、抽出したいのは次の赤字の顧客となります。
購入日 | 製品カテゴリ | 購入数量 | 購入金額 | 顧客ID | 購入日_1 | 製品カテゴリ_1 | 購入数量_1 | 購入金額_1 |
---|---|---|---|---|---|---|---|---|
2021/1/1 | キウイ | 2 | 7200 | 10982 | ||||
2021/1/2 | キウイ | 1 | 3600 | 16876 | ||||
2021/1/3 | キウイ | 1 | 3600 | 29786 | ||||
2021/1/4 | キウイ | 2 | 7200 | 29787 | 2022/1/6 | マンゴー | 3 | 360 |
2021/1/5 | キウイ | 3 | 10800 | 27563 | 2022/1/7 | マンゴー | 2 | 480 |
「結合」の右の「+」をクリックし、「フィルタ」ステップを追加します。
「製品カテゴリ_1」に対してフィルタを設定します。
「NULL」チェックボックスをオンにします。
「フィルタ」の右の「+」をクリックして「列の選択」ステップを追加します。
「~_1」で終わる列は不要なので、まとめて選択して「選択項目の除去」をクリックします。
「列の選択」の右の「+」をクリックして「データの保存」ステップを追加します。
データセット名を「顧客分析」とします。
データフローの保存と実行
右上の保存アイコンをクリックします。
データフローに名前を付けて「OK」をクリックします。
「データフローの実行」アイコンをクリックすると、定義したフローが実行されます。
顧客が抽出できたかどうか確認
「ナビゲーション」アイコンをクリックし、「データ」をクリックします。
「データセット」タブに、データフローで設定した「顧客分析」という名前のデータセットができあがっているのがわかります。
データセットをクリックすれば、ビジュアライズが可能です。
この次は?
顧客属性を知るためのデータを準備し顧客IDと結合することで、より深い分析が可能になります。
例:顧客ランク、居住地、年齢グループによる顧客行動を分析するなど。