この記事は アイスタイル Advent Calendar 2022 3日目の記事です。
こんにちは、アイスタイルが運営しているサービスを横断して、計測・データ基盤構築・BIツールなどデータのライフサイクルに携わっている やす です。
本記事は、普段担当しない、もしくは初めてのサービスや事業のデータ分析案件に携わったときに、そのような逆境の状態でも 価値があるデータ分析 を行うためのプロセスをまとめたいと思います。
※ 筆者はWEB業界×化粧品業界のデータエンジニア/データアナリストなので、前提の抜けた説明や単語の利用があるかもしれませんがご了承ください。
背景:専門領域ではない分析案件にアサイン
データ分析を仕事にする中で、対象となるプロダクトやサービスの知識がない状態でデータ分析を行う場面は自身の経験としてありました。
一般的にはデータアナリストの方が別業界への転職や、退職に伴う引継ぎで普段行わない領域の分析をする場面にも当てはまると思います。
そのような逆境の中で 価値のあるデータ分析を行うために実践している一つのプロセスを紹介したいと思います。ここでの価値のあるデータ分析とは 分析だけでなく、アクションにつながる新たなアイディア を価値とします。
ただし、分析する対象の知識がある人(プロジェクトマネージャー、プロダクトオーナーなど)に対して、知識や経験ががない状態のデータアナリストが成熟するには時間がかかります。
この「新たな」を見つけるためのプロセスを以下に紹介します。
方法:転がっているドメインを拾いに行く
ドメインとは
以下はシステム開発におけるドメイン駆動開発の引用ですが、ドメインとはまとめるに「対象となる領域とそれを構成する要素」と解釈しています。例えば、業務が手順書化されており言語化されているものなどはわかりやすく理解ができ、ドメインの知識が獲得しやすい形です。
今回は 新たなドメイン を見つけるために、隠れているドメイン をまず見つけにいきます。
ドメインは「領域」の意味をもった言葉です。ソフトウェア開発におけるドメインは、「プログラムを適用する対象となる領域」を指します。
引用元: ドメイン駆動設計とは何なのか? ユーザーの業務知識をコードで表現する開発手法について|CodeZine(コードジン)
重要人物の会議の発言/言いまわし
仕事で関わる人で、分析する対象の知識がある人(プロジェクトマネージャー、プロダクトオーナーなど)の 無意識の前提 はその人の発言に現れることがあります。
例えば、ECサイトに関連するPJTオーナーが今月の目標を話すときに「新規/既存のユーザーの数を目標にして、特に新規のユーザーを増やしていこう」と発言があった時「新規/既存」はECサイトチームでの前提知識の上で成り立っているのがわかりますでしょうか。
いったい何を初めてした人が新規で、すでに何をした人が既存なのか がポイントです。
この場面ではそういった 前提 が隠れています。ここではECサイトですので「新規/既存」 は「初めて購入してくれた人/すでに購入経験がある人」とします。
つまり 対象は購入した人という前提 が隠れています。
ドキュメント/クエリなどの成果物
必ずしも会議の発言に隠れドメインがあるわけではなく、ドキュメントの文章や過去の方が残したデータ分析のクエリ、レポートなどにも隠れています。
特に議事録や要件をまとめたスプレッドシートなどにも上記のような 言い方が曖昧だけど相手は伝わると思っている 情報はたくさんあります。
「モレなく・ダブリなく」の観点で仮説を立てる
先ほどの例では 対象は購入した人という前提 という隠れドメインを見つけました。この隠れドメインを モレなく・ダブリなく の視点で考えると 購入しなかった人 という反対のイメージを作ることができます。
ここでは隠れドメインから新たな観点を生み出すことに成功しました。
そしてデータ分析へ
上記の仮説に基づいて、例えば購入しなかった人のグルーピングで購入の手前の行動、例えばWEBサイトのページビューやSNSなどのいいねの数を利用し、行動パターンの分析などを行い、仮説を磨き、分析結果から施策提案やプロダクトオーナーと議論をすることで、隠れドメインを利用した 価値のあるデータ分析 をすることが可能です。
最後に注意点
ただし、隠れドメインは意図して排除している場合もあります。優先度やリソースの関係、過去に効果検証したけど新たな情報は得られなかったなどの理由が考えられます。それでも、逆境の状態から議論の範囲を広げられたり、過去の知見を得るきっかけになります。
※ このアプローチは決して言語化されているドメインに向き合ったデータ分析を否定するものではありません。その積み重ねがあるからこそ 隠れているドメイン ができています。