本書は2017年4月1日にTeradata Japanのブログに掲載された内容を、再掲載したものです。
掲載内容の正確性・完全性・信頼性・最新性を保証するものではございません。
また、修正が必要な箇所や、ご要望についてはコメントをよろしくお願いします。
著者 山本 泰史 (やまもと やすし)
セグメンテーション/ターゲティングの考え方
第2回:セグメンテーションの基礎 - 1
セグメンテーションの単位
前回は、セグメンテーションとターゲティングの違いについて主に概観しました。今回及び次回はセグメンテーションの基礎について整理していきます。このコラムで中心に取り扱う、セグメンテーションの単位は個人です。しかしながらセグメンテーション、つまり同一もしくは近似の変数を用いて細分化し、企業活動に役立てるという意味では、識別可能な個人にとらわれる必要はありません。 若干本論から外れますが、セグメンテーションがより広範な概念であることを理解いただくために、一つの例をご紹介しましょう。
とある喫茶店を思い浮かべてください。 この喫茶店では来店客が誰であるかを識別できませんが、取引と接客からセグメンテーションを行い、さらにターゲティングを行うことが可能です。例えば朝であれば朝食と目覚まし代わりのコーヒー、タバコのために来店する顧客が存在し、モーニングセットや煎れたてのコーヒーがこのセグメントをターゲットとしたときのオファーとなっていることでしょう。 同様のセグメンテーションは、図2 に示したように可能となるはずですし、このセグメンテーションの単位を取引(オーダー)であるとした場合、取引データからそれぞれのセグメントが保持しているボリューム(来店客数)や収益性(平均的なオーダー額から導かれる利益)も理解できるようになるはずです。 また商圏環境が変化したことによる取引セグメントの変化も見出すことが出来ることでしょう。例えば近くにオフィス街ができれば朝に特有の取引セグメントは増加の傾向を示すかもしれませんし、隣に美味しい中華料理店ができれば昼に特有の取引セグメントは減少傾向を示すことでしょう。中華料理店に奪われた顧客を取り戻すためのカウンターオファーを考えた場合、このときのターゲットセグメントは昼に多く来店していた顧客層から、中華料理店に取られてしまった顧客層に絞り込んだ顧客層ということになりますし、取引セグメントという観点からは、例えば今までこのお店で、お昼にチャーハンを頼んでいた取引セグメント、つまり 11時半から 13時程度の間で、チャーハンが含まれていたオーダーがカウンターオファーを実施するべきターゲットとなります。
一方で 1人の個人に視点を移すと、もしかしたら朝食セグメントと昼食セグメントの、それぞれに該当する取引を発生させている顧客が存在するかもしれません。 この顧客は 2つの顔を持ち、上述したケースであれば昼食セグメントの顔が離反していると考えることも可能です。つまり言い換えれば、これはその個人の、時間によって異なる行動属性をセグメント化し、それぞれに対してターゲティングを行うことと近しいことを意味します。 唯一欠落しているのはこの 2つの取引をつなぐ顧客を識別する術がここでは存在しないということです。当たり前のことなのですが、ほとんどの方は朝食と同じメニューを昼食に食しません。昨日着た服と同じ服を今日も身にまとうことは、人生においてそう多くないことでしょう。 この個人の中に発見される多様性やその範囲は、個人識別をしてしまうことによって見逃されがちな理解の対象であるとも言えます。問題は 1人の個人であることを識別できてしまうが故に、その個人を出来る限り分かりやすいステレオタイプに当てはめてしまうことにあります。 分かりやすくする努力そのものは問題ではありません。しかしながらその個人が持つ、本来複雑で豊潤な多様性をスポイルしてしまい、それによってビジネス機会を逃してしまうことは避けられなければなりません。このため取引をベースとしたセグメンテーションは、意図的に識別可能な個人という概念を隠すことによってその行動属性そのものを浮かび上がらせるという意味においては、考慮に値する重要な選択肢の一つであると言えます。 さらに、識別可能な個人が存在する場合には行動属性と個人を n : 1 の関係で関係付ける形で発展させることも可能です。
セグメンテーションの基礎1 - 量的変数と質的変数
個人を単位としたセグメンテーションに話を戻します。 セグメンテーションを、顧客をセグメント化(細分化)する作業であるとした場合、セグメンテーションの基準は個人の属性ということになります。 単純な男女の別をセグメンテーションに適用するのであれば、性別という属性を用い、その中の変数は、一般的に男性、もしくは女性の 2種類に分けられることになります。そして通常、1つの属性は n個の変数を持ち、1つのセグメントは、n個の属性を対象にしており、それぞれの属性における変数のある部分を選択することによって定義されます。 特定の属性を条件にしたセグメンテーション(例 : 女性セグメント)も想定されますし、複数の属性及びその条件を規定したセグメントも想定されます(例 : F2セグメント)。また、セグメントグループはセグメントの集合です。セグメントグループ内の各セグメントはお互いに排他的であり、かつその集合が包括的な顧客リストとなります。 単純な男女の別をベースにした性別セグメントグループであれば、“男性”、“女性”、及び “不明” はそれぞれに排他的であり、その集合が包括的な顧客のリストとなります。セグメントは必ずしもセグメントグループに含まれる必要はありません。しかしながらセグメントグループに属する場合は、上述したルールに基づいてセグメントグループ全体で包括的な顧客リストを構成し、セグメントグループ内の構造はセグメントにて概観できるようになります。
図3 に簡単な整理をしておきますが、これらがセグメンテーションの大枠であり、基礎的な概念です。そして変数には、2つの種類が存在します。 1つは量的変数、もう 1つは質的変数です。量的変数は、例えば購買金額等のように数値化され、かつ変数間の数値幅が意味を持つものです。 年間利益額が 100円の顧客と、200円の顧客では、その企業に対する利益貢献度としては 2倍の違いがあります。 平均的な週あたりの来店頻度が 2回の顧客と 4回の顧客では、来店頻度に 2倍の差が有ります。 この場合、2つの変数間にはその変数をベースに比較する基準が存在することを意味し、実際にその違いの大きさを比較することに意味があるであろう変数です。
これに対して質的変数を量的変数の定義と対峙させた場合、数値化された変数間の数値幅が意味を持たないものと捉えられます。 仮に男女の別をそれぞれ 1と 2で表現したとしましょう。男性 = 1、女性 = 2となっているのを入れ替えて、男性 = 2、女性 = 1にしても同じ意味を持ちます。 どちらを 1もしくは 2にするかという問題は、単なるルール付けだけの問題です。男性と女性の間には何らかの度数が 1 : 2 の関係で存在する訳ではなく、単純に違うという事実だけが存在し、何らかの 2倍のパフォーマンスを女性が保持しているということは意味しません。 従って、例えば管理上の煩雑さを考えなければ、男性 = 1、女性 = 3という数値に置き換えても意味は通ることになります。同様にある食品のアンケート調査結果で、美味しい = 3、普通 = 2、美味しくない = 1とした場合、数字が大きいほど調査で食したものに対する好感度は高いことがうかがえますが、美味しくない( = 1)、と美味しい( = 3)に 3倍の違いがあることは意味しません。 当然ながらセグメンテーションやターゲティングにおいてこの順序を検討することに意味があるとは思いますが、この場合それぞれ “美味しい” と “普通”、そして “美味しくない” の間にある距離感を、ここから掴むことはできません。 そもそもサンプルそれぞれがもつ感覚も違いますし、常識的に考えても、“すごく美味しい” と “どちらかと言えば美味しい” は “美味しい” というカテゴリーの中に閉じ込められていることが容易に想像できるからです。
では、例えば年齢という変数はどのように捉えられるでしょうか。ユリウス日を用い、現在日付から生年月日を差し引き、365 で割れば単純な年齢を算出することが可能です(正確にはうるう年等が考慮されなければなりません)。 1974年1月1日生まれと、1975年1月1日生まれの間には、ちょうど 1年分の生後経過日数差が存在し、これは量的変数ということが出来ます。 もちろん生まれた時間は違いますから厳格にはこれでも最大24時間未満の誤差が存在しますが、少なくともマーケティングにおいては許容しても構わないレベルです。同様のことは年齢にも言えます。あと 1日で 30歳の誕生日を迎える人と、昨日 29歳の誕生日を迎えたばかりの人は、厳格には 364日の経過日数差がありますが、変数としては 29歳という変数に含まれます。これもマーケティング上は許容可能なレベルであり、いずれも量的変数と判断できるでしょう。 では 20代と 30代という変数区分を利用した場合はどうでしょうか。20歳と 29歳は同じ区分に含まれ、29歳と 30歳は、異なる区分に含まれるとした場合、20代と 30代という年齢層セグメントの変数は、量的な意味を有していないように見えます。そもそも 29歳は 20歳よりも 30歳に近しく、29歳と 30歳を別に区分する根拠は、人間の意図的なものです。この変数区分は、例えば 50代と 20代をそれぞれ比較する場合には当然ながら意味を発揮します。 一方で 29歳から 30歳になってその個人の生活パターンや嗜好性ががらりと変わることは稀です。だからといって変数区分を 40歳 - 41歳の間に求めても問題は解決しません。同様のことは今日 41歳の誕生日を迎えた人と、明日 41歳の誕生日を迎える40歳の人にも言えることだからです。 結論としては、一般的に企業が個人から情報を取得するのが生年月日のレベルである以上、そして 1つの変数が含む値の幅364日が許容範囲の限界であるという前提において、年齢は量的変数であり、年齢層は質的変数であると判断できるということになります。もっともこれは真実であるかではなく、そう判断するということでしかありません。セグメンテーションを実施していく上で、利用可能な属性を網羅し、その属性が持つ変数が人為的な変数定義を必要とする場合には、この変数の持つ意味にまず着目する必要があります。
マーケティングにこれらの変数を利用する上で重要な点は、個々のサンプルが持つ変数を比較する際に、純粋に異なるという概念で比較すべきものなのか、順序(優劣、大小等)という概念で比較するべきものか、それともある一定の単位を用いて比較しうるものなのかという点です。 これら変数が何を意味しているかを理解し、最適な粒度を選択することが重要となります。例えば、健康食品会社や化粧品会社が、ある調査結果から肌の老化を大きく感じるのは 27歳であることを発見したとします。これに対応する商品をオファーする際に、年齢層でくくった 30代以上をターゲティングすることは、3歳(年)分の顧客層をまるまる見逃してしまうばかりでなく、27歳の最も反応度が高いであろう顧客層を見逃してしまうことになります。 仮にこれらの企業が個別コンサルティングを行えるのであれば、顧客ごとの肌年齢の違いや顧客との対話のほうが、より豊かな顧客理解のベースとなり、木目細やかなマーケティング対応の可能性を与えてくれることは間違いありません。しかしながら取得できるデータの限界が人口の一般値( 27歳 )と、個人の年齢だけであるのであれば、最大限獲得可能な年齢レベルの粒度を用いることが、離散させた年齢層を用いるよりも大きな結果の違いをもたらすことになります。
以上、セグメンテーションの基礎として量的変数と、質的変数についてご紹介しました。次回はセグメンテーションの基礎、第2回目として属性の種類について触れていきます。