この本書は2017年4月1日にTeradata Japanのブログに掲載された内容を、再掲載したものです。
掲載内容の正確性・完全性・信頼性・最新性を保証するものではございません。
また、修正が必要な箇所や、ご要望についてはコメントをよろしくお願いします。
著者 山本 泰史 (やまもと やすし)
顧客分析の手順
第3回: データの整理
顧客分析でデータを準備するにあたって、どのようなデータが利用可能かを整理する必要があります。通常データウェアハウスには、正規形もしくはそれに近い形でデータが格納されており、それを利用者が使いたい形式に集計、派生、変換して利用します。顧客分析においても同様のプロセスを踏みます。
正規形で格納されたデータとは、技術的定義を抜きにして簡単に表現すれば、データの重複を排除しつつ、各データ項目間の関係性が適切に維持されたデータ保持の形式です。これによって取り出したいデータがどこにあるかを一意に特定でき、あるデータと別のデータを関連付けて取り出せるようになります。しかしながら見たい形は利用者によって異なるため、データを取り出す際にその形式へと変換します。
ここでは、一般に最終消費者と直接的な取引をする企業において保持するであろうデータ項目と分類、そしてその関係性について、大まかにご紹介します。もちろん個別企業によって得られるデータは異なるため、それぞれの企業で適用する際にはこれを雛形に自社向けに定義しなおす必要があります。
データ項目
以下の図4 に代表されるデータが分析の対象となります。大きくデモグラフィックデータ、サイコグラフィックデータ、そしてビヘイビアルデータに分けています。
デモグラフィックデータ:
日本語にすると人口動態データとなりますが、人口動態調査によく用いられるようなデータの意です。性別、年齢といった個人の特徴や保持物品(自動車の車種や不動産等を含む)を表すデータが対象です。例えば自動車保険を扱っている企業であれば自動車の車種データを有することは不自然ではないですが、クレジットカード企業がこれを持つことは困難かもしれません。そのため保持できるデータには業界によって違いがあります。共通して保持できるのはお名前、性別、年齢、住所といったデータが該当すると想定します。また便宜上、顧客を識別するために付与された顧客番号データ(世帯番号や口座番号等も)をここに含めています。
サイコグラフィックデータ:
心理的特徴に関するデータ。アンケート調査が主な入手ソースとなります。このデータの分析上の強さは、顧客行動の背後に存在する意図をより深くできる点にあります。しかしながら一方ですべての顧客から同一レベルのデータを入手するのは困難であるため、分析目的によってはデータとして適切でない場合もあります。また、アンケート取得時点での心理特徴を捉えたデータでしかないため、その後の心理的変化を考慮するには、継続的に同等のデータを取得していく必要があります。
ビヘイビアルデータ:
行動的特徴に関するデータ。電子的に構築された POS、ATM、コールセンター、Webサイト等のチャネルであれば、自動的に取得できるという特徴があり、またデータの量としても充分に活用可能なだけ確保できるという特徴を有します。一般に取引データを意味しますが、契約、Webサイトの訪問ログ、電話会社における通話履歴等もここに含まれます。
データの分類
データベース上のデータは大きく、本来の意味のデータである「実績」データと、実績データがなんであるかを説明してくれる「マスターデータ」に大別されるのが一般的です。実績データは上述したデータ項目におけるサイコグラフィックデータとビヘイビアルデータが該当します。一方でマスターデータ(階層データを含む)に関しては以下が主たるものです。
1. 顧客マスター:上述のデモグラフィックデータが該当(誰の行動なのか?)
2. 商品/サービスマスター(何に関する行動なのか?)
3. カレンダーマスター(いつ発生した行動なのか?)
4. チャネルマスター:店舗マスター、Webサイトのページマスター等(どこで発生した行動なのか?)
括弧内は、実績データをどのように説明してくれるかについて示しています。また、以下のようなマスターデータも保持候補です。しかしながら本稿では、別稿(キャンペーン評価の手法)にてこれらの利用について解説しているため、以下を利用したキャンペーン評価の分析に関しては割愛します。
1. キャンペーンマスター(どんなキャンペーンを案内したのか?)
2. マーケティング経費マスター(幾ら費やしたのか?)
データ間の関係
ここまでの関係を図示したのが以下の図5 です。実績データは「誰が?」、「何を?(商品/サービス)」、「いつ?」、「どこで?」、そして「どれだけの量の行動を起こしたのか?(もしくはある行動を起こしたか、否か?)」についての履歴を有しています。そしてこれに対してマスターデータを通じて識別、説明ができるように関係が記述されています。データベース上では実績データの外部キーと、マスターデータの主キーが対応するようになっており、このキー(コード情報)を紐づけることによってデータ全体がつながっています。
以上、顧客分析に利用される代表的なデータを概観しました。次回はこれらのデータを用いて、分析に利用しやすいようにデータを整理しなおします。