本書は2017年4月1日にTeradata Japanのブログに掲載された内容を、再掲載したものです。
掲載内容の正確性・完全性・信頼性・最新性を保証するものではございません。
また、修正が必要な箇所や、ご要望についてはコメントをよろしくお願いします。
著者 山本 泰史 (やまもと やすし)
第4回:セグメンテーションの手法
セグメンテーションの手法1 - 変数の作成
今回から、セグメンテーション変数の作成というテーマに移ります。もっとも基礎的なセグメンテーションは、自然変数を用いたセグメンテーションです。例えばデモグラフィック属性としての性別は、なにも作成するまでも無く、データベース上のデータをそのままセグメンテーションとして利用することが可能です。しかしながら一方で、もっと詳細に顧客をセグメントに分類したい場合、幾つかの属性変数を組み合わせて、セグメンテーションを構築することも想定されます。図4 を参照ください。ある百貨店を想定した例です。
性別が女性であるという属性変数と共に、来店時間や曜日、利用したサービスをベースに変数をカットして、それぞれのセグメント属性に名前を付けています。当然ながらいずれにも合致しない顧客も存在するため、それらをノイズセグメントとして置いています。将来的にここから購買傾向の変化を示すことによって、いずれかのセグメントに属するようになる顧客も存在するかもしれませんし、ここでカットした変数特性からは鈍化し、いずれかのセグメントに属していたのが、ノイズセグメントに属するようになる顧客も発生することでしょう。ここで記しているセグメントは、それぞれの顧客が置かれた生活をその変数が反映しているであろうという前提に立っています。同様のことは、価格や割引への反応度合いを表すセグメント、特定のチャネルへの吸着度合いを表すセグメント、特定の商品や商品属性(例えば色や機能、ブランド等)への執着度合いを表すセグメントに分類することにも適用できるでしょう。これらのセグメンテーションは、企業が自らの顧客に対する輪郭を掴むことを可能にすると同時に、実施するターゲティングを容易にします。 もちろん実施するキャンペーンごとにこれらの絞込みを行い “有閑マダム” を識別することも可能ですが、それらの手間を省くと共に、“有閑マダム” で “特定ブランドを支持” している顧客層といった具合にターゲティングを何層にも絞り込んでいくためのベースにすることが可能となります。
それでは、上述したようなセグメントの変数区分を作成していくための手法に関して、次に触れていきます。上記の “有閑マダム” セグメントが用いている変数には、購買発生時間の 51%がある一定時間帯に発生しているという定義にしています。これには 2つの理由があります。1つは単純に他のセグメント変数、特に “OL会社帰り” と互いに排他的な顧客を選定するために過半数の最低値を利用しています。これによって、全顧客がノイズセグメントも含めたいずれかに重複無く含まれ、合計が 100%の顧客で構成されるようにしています。 もう1つの理由としては、ある一定時間帯での購買が高いことを示すために 51%という値を用いています。しかしながら、51%が妥当であるかどうかは誰にも分かりません。 もしかしたら 50%も含むべきかもしれません。例えば、オン/オフの変数(男性/女性、買っている/買っていない)の場合、変数基準を導くことは容易なことです。しかしながらこの属性を選択するべきか否かを決定すること、そして複数のカテゴリーに分かれる質的変数や量的変数の中で最善の変数基準を設定することは、判断が難しい場合があります。この場合に利用するのがデータマイニングや統計解析の手法です。 詳しくは専門書に譲りますが、統計上の観点から、例えば上述のケースであれば何%が妥当であるかのかという変数基準を提供してくれます。
もちろんデータマイニング等の手法を用いなくとも、マーケターが自身の判断で変数基準を設定し、セグメンテーションを行うことも可能です。手法としてデータマイニングを用いたにしても、結局の所それを実際のターゲティングもしくはその他のビジネス活動に適用するか否かは人間の判断であり、人間の責任になります。例えば割引プロモーションに対する反応度をセグメンテーションとして利用するとしましょう。 反応度を判断するために、過去の割引プロモーションへの反応を点数化します。10回中 3回反応すればスコアは 3.0、100回中 24回反応すれば 2.4 と点数付けします。さらに過去のサンプルが少ないケースを排除するために、前提条件として過去に割引プロモーションを 5回以上案内した顧客を前提とすることにします。 以上を数式化すると、図5 のような形となります。
懸念材料としてこの点数を元に割引プロモーションを何度も案内していくと、コンタクトの初期タイミングで割引プロモーションの対象とならなかった顧客が、だんだん割引プロモーションから疎遠になり、あるタイミングでその顧客の意識や置かれた環境が変化し、心理的に変化した反応度が、ビヘイビアル属性に現れない危険性が想定されます。 これらを回避するため、数式を高度にする(時間軸や割引幅に応じてスコアに加重を行う等)、または時折反応をキャプチャするためにプロモーションをかける必要があるかもしれません。 ここではあくまでもシンプルな例に留めましたが、重要なポイントは、ある一定の数式(モデル)に基づいてその顧客の点数(スコア)が算出され、そのスコアをベースにセグメンテーションが構築されるという点です。場合によってはスコアをある一定の基準でカットし、実質的に利用するセグメンテーションの変数区分に利用することも考えられます。先ほどの割引プロモーションに対する反応度であれば、反応度のスコアがトップ 1,000 の顧客を “反応度の高い” 顧客セグメントと判断することも可能ですし、トップ 30%の顧客、もしくはスコア 5.0以上の顧客を変数区分とすることも想定されます。 また、この区分設定に検証結果を用いることも考えられるでしょう。例えば 80%以上の確率で反応することが “反応度の高い” 顧客に対する期待値であり、検証結果から上述したスコアの 8.5ポイント以上がこの結果を返したのであれば、8.5以上を“反応度の高い”顧客セグメントとして定義することになります。このようなモデリング/スコアリング/区分化の手法は、伝統的なダイレクトマーケティングにおいても実施されています。 RFM や Life Time Value の計算は、ある一定の数式、つまりモデルに基づき、顧客をその数式に適用することによってスコア(量的変数化)を導き出し、必要に応じて区分化(質的変数化)します。同じことが他の顧客行動にも適用できない理由はなく、数式の複雑度や対象となる変数が異なるだけで、ロジックは同じことです。
セグメンテーションの手法2 - セグメント変数の保持方法と利用
セグメンテーション手法の最後として、セグメント変数の保持方法と利用について触れていきます。 顧客毎の行動や特性を変数として捉え、利用していく際には 2つの利用方法が想定されます。1つ目は、特定の属性変数を保持するセグメントの最新状態を利用する方法であり、もう 1つの利用方法はセグメント付与結果を履歴として保持し、過去から現在までの流れを理解し、これを利用する方法です。 例えば、シンプルに来月保険契約の期限が切れる顧客向けに継続を促すキャンペーンを実行する際、1年前のデータをもとにしたセグメンテーションをベースにターゲティングを行っても意味がありません。キャンペーンを実行するタイミングから見て来月保険契約が切れる顧客をリストアップしなければなりません。この場合には鮮度が重要であり、常にリストは最新である必要があります。そしてこのような利用をする場合には、そのセグメントを特徴付ける変数条件を保持し、キャンペーンに利用する際にその変数条件に合致する顧客を常に最新状態に反映する手法が必要となることでしょう。このような保持の仕方を、変数条件のみ保持し、中身の顧客リストは都度入れ替えるためにスケルトン(骨組み)セグメントとここでは呼ぶこととします。
一方で、最新であることよりもその顧客がどのようにセグメント変数を渡り歩いたかが重要な意味をなすときもあります。 これは顧客の足跡を理解する意味で、トレイル(足跡)セグメントと呼ぶことが出来るでしょう。例えば、旅行業において “ホリディトリップ(= 休日やインシーズンの、家族連れの旅行が多いセグメント)” から “パーマネントバケーション(= 平日やオフシーズンの、夫婦 2人での旅行が多いセグメント)” にセグメントを移動した顧客には、どのようなことが想定できるでしょうか。 おそらくライフステージの変化があったことが想定されます。同様の変化は、利用商品やサービスのボリューム、タイミング、嗜好性等の変化をセグメント変数として捉え、これらを履歴で保持し、把握していくことによって理解できることでしょう。単純に自社に対する支出金額が減少傾向にあれば、離反の危険性が想定されますが、これも毎月の支出金額をセグメントの属性変数として捉え、履歴で把握することによって離反危険性を察知する考え方と理解できます。 ランドセルの購入から 6年間を特定のセグメントとして認識するとき、そのセグメンテーションの意図は明確であり、セグメントの入口と出口はかなり明快に識別できるはずです。いずれにしてもセグメント属性間の移動(In/Out)は、重大な顧客にとってのイベントの発生を意味します。このイベントのタイミングに合わせてオファーの内容を変えることが出来れば、正しいタイミングで顧客の変化に対応することが可能となりますし、新たなビジネスチャンスの発生を “待ち受け” て、それをトリガーにコミュニケーションやその方法の変更、新たな方向付けを行うことが可能になります。 また同時にこれらの変化を無視してしまうことによって発生する顧客との “反り” は、顧客に対して無用なコンタクトやオファーを生み出します。これは時に顧客の気分を害するのみならず、無用なキャンペーン経費を垂れ流す危険性へとつながります。セグメント変数間の移動を理解することによって、顧客との “反り” を回避し、顧客の文脈に添った形でのマーケティングを実現することにつながるのです。
またトレイルセグメントは、セグメント変数間の移動を考慮する以外にも利用方法があります。 セグメント毎のチャネルコンタクト頻度、利用/購入金額、利益金額、そして該当する顧客数等を履歴で理解し、必要に応じてセグメント属性間で比較することによって、自社がビジネスをしている顧客セグメントの趨勢を理解することが可能となります。 これらに合わせてマーケティングを行うことも重要になりますし、商品やサービス、チャネル等をメジャーセグメント中心に構築する、または収益性の高いセグメントに対してキャンペーンや商品開発の投資額を傾斜することも考えられます。また、同様にスケルトンセグメントに関しても、セグメント属性間の関係にも注目するべきかもしれません。 例えばファッションアパレル等の流行が生まれ、そして消えていく分野においては、それらの先陣を切って購入をする層、フォローする層、流行のピークで購入する層、全く反応しない我が道を行く層といった形で分類することが考えられます。それぞれを A、B、C、D とし、ある過去に流行したファッションに対してどのタイミングで購入が発生したかを見ることが可能です。 当然ながら流行とならなかったファッションもありますので、A の層においてそれぞれのファッションがどの程度支持されたのか、または A から B への伝播がどの程度発生したのかを見ることによって、リトマス試験紙的にそのファッションが流行となるか、後続のピークポイントである C へのアクションが必要かを見極めることも可能となります。 また A はオピニオンリーダー的な役割を担っていることから、これらの顧客層からはインタビュー等の時間をとり、それなりの報酬と引き換えに商品開発の参考にする、またはテスターとしての役割をお願いすることも想定できるでしょう。 また、D に対して流行りモノの商品を案内することが経費と時間の無駄であることも想像に難くありません。
以上、スケルトンセグメント及びトレイルセグメントについてご紹介しました。 最後に、それぞれのセグメンテーションについて簡単に技術的な捕捉をします。 スケルトンセグメントは、変数条件は作成の上保持しておき、必要になった際に “その場で” データベースに対して検索を実行することによって、キャンペーン等に役立てます。 これに対してトレイルセグメントは、コンピュータで変数を判断し、時には計算をして、一定期間毎に顧客に対して付与し、履歴で保持していく形になります。しかしながら作成したセグメンテーションそのものが廃れることも、新たなセグメンテーションを分析の結果発見することも考えられるため、セグメンテーションそのものをファインチューンして利用していくことも想定しなければなりません。 セグメンテーションが完成するということは自社のビジネス環境やビジネス活動が変わっていく限り有り得ないことです。継続的なセグメンテーションの開発が必要になると共に、特にトレイルセグメントに関しては素データを保持し、新たなモデルを用いて遡及し、セグメントを付与し直すことも重要になります。
以上、セグメンテーションの単位、変数、属性から、セグメンテーションの作成と管理についてご紹介してきました。次回以降はこれらのセグメンテーションを利用したターゲティングの考え方について触れていきます。