7
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

DiverseAdvent Calendar 2020

Day 3

データ分析におけるセグメント分けの考え方

Last updated at Posted at 2020-12-27

はじめに

分析の定義にもいくつかあると思いますが**「数値を分解して、構成や特徴を明らかにする」**と言っても大きな間違いはないかと思います。数値を分解するために「何かの値」を「何かごとに」に集計して、色々と考察するわけですね。

この記事では、「何かごとに」のことを大雑把にまとめてセグメントと呼ばせてもらいます(セグメントと呼ぶのはマーケティング領域における分析の場合である印象はあるのですが、他にちょうど良い呼び方が見つからなかったもので)。私がマッチングアプリに携わる中で得たセグメント分けの考え方を紹介させてもらいます。

※ちなみに私は分析の専門家ではありません。PdM/PjMを担当する中で積極的に分析をしてきた「現場叩き上げの素人」の知見として見ていただけましたら幸いです。なお、「統計学が最強の学問である[実践編]」がとても勉強になっていまして、ご紹介している考え方の中にも散りばめられています。

セグメントの種類

まずセグメントの種類としては、大きく分けると以下のようなものがありますね。マーケティングの領域でよく上げられていると思います。

  • 人口統計(デモグラフィック)
    • 性別、年齢、学歴、職業、所得など
  • 地理(ジオグラフィック)
    • 地域、気候など
  • 心理(サイコグラフィック)
    • 趣味嗜好、動機など
  • 行動
    • 利用時間、行動履歴など

人口統計・地理は、データを取りさえすれば扱いはシンプルですね。行動はデータを取るのにも扱うのにも手がかりますが、強力な気づきを得られることが多いですね。心理は、最強レベルの気づきが得られるのですが、使える精度でデータを取るのは難易度が高いですよね。

分ける時の基本の考え方

私がセグメント分けでベースにしている考え方がこちらです。
1回の集計と確認でセグメント分けが確定することはほぼありませんね。簡単なもので数回、多いと数十回集計し直します。

データの分布を確認

そもそも分析で一番と言っていいくらいに重要なことだと思います。
最大級にやってはいけないと考えているのが**「セグメント毎の集計値を見ることからスタートしてしまい、傾向や特徴を見逃すこと」**です。必ず分布を確認してからセグメント分けを考えましょう。

悩んだら一定の量で分ける

既にある程度特徴を把握していたり、初めて分析するものだったりすると、どのぐらいずつで分けるか悩むことがあります。そんな時はまずは素直に一定の量で分けて見てみましょう。
例えば、年齢であれば5歳区切り等。

「特徴・傾向が集まるグループ」になる確度を上げる

分析の目的が現状把握なのであれば、これはあまりやらないほうが良いケースが多いと思います。

しかし実際は、多くの分析が「データから気づきを得る」ために行われています
杓子定規に分けたセグメントでは傾向や特徴が見えづらくなるケースも多く、目的である「気づきを得る」ことが果たせなくなってしまいます。そんな時はデータの分布を見ながらセグメントの分け方を調整します。
例えば、都道府県であれば関東でまとめて終わらずに「東京」「埼玉・神奈川・千葉」「栃木・茨城・群馬」に分ける等。

ただし、これは主観が多分に入り込む操作になるため、客観性を忘れずに慎重に行う必要があります。

分析後のアクションを意識してセグメントを選ぶ

ほとんどの分析は、そこから得た気づきをもとに何らかのアクションを実行しますよね。その時にコントロールできないセグメントでうまく分析できても、気づきで終わってしまうか、コントロールできるような仕組みの開発が先に必要になります。すぐにアクションを起こしたいのであれば、 価値の大小は 分析結果の点数は高いがアンコントローラブルなセグメント分け < 分析結果の点数はやや落ちるがコントローラブルなセグメント分け になります。

セグメント分けの例

私がマッチングアプリでよく使う分け方の一例です。

[年齢]
18〜19歳
20〜24歳
25〜29歳
30〜39歳
40〜49歳
50歳〜

[利用期間]
0〜15分
16〜30分
31〜60分
61分〜3時間
3〜6時間
6〜12時間
12〜24時間
2〜3日
4〜7日
8〜14日
15〜30日
31〜90日
91〜180日
181〜360日

基本の考え方にプラスして、過去に見てきた数値からの知見を使って分けています。

  • 年齢
    • 若いユーザーは人数が多いのであまり大雑把に分けすぎない
    • 30代未満の傾向を細かくみるのであればら2歳区切りぐらいが良いが、細かく分けすぎずにまずはデモグラフィック等の違いも出やすい10代、20代前半、20代後半で分ける
    • 30代以上は人数も少なくなりはじめるのと、年齢による傾向の変化スピードが鈍化するため、大雑把に分けていく
  • 利用期間
    • ユーザーの熱が冷めるのは非常に早いので、利用開始直後は分単位で見る
    • 時間経過に合わせて期間は伸ばしていく
    • 利用開始初日のあとは、傾向が似てくる単位で区切る。頭への入りやすさを考え、具体的な単位には馴染みのある数字を選ぶ

各セグメントの重要度

傾向に違いが出やすいことを重要度とした場合の、マッチングアプリにおける私が考える重要度です。
何を分析するかによって重要度は変わりますが、色々な分析をふりかえって総合的に評価した一例です。

性別 >>>>> 動機(取得しづらいけど) 
 > 利用期間 > アクション受信状況 > 年齢 >> デバイス
 > 曜日 >> 天気 >> 地域

最後に

セグメント分け(に限らず分析)で一番大事なのは、基本の考え方にも書きましたが、データの分布を確認することだと思います。

分析は一番最初の「何かの値」を選ぶところから既に主観が入り込みますが、「何かごとに」に何を選びどう分けるかのところから更に加速度的に主観が入り込みます。その主観をできるだけ目的に適したものにできるかどうかで、分析の質はかなり変わってくると思います。面倒でもしっかり分布を確認しましょう。

7
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
7
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?