前書き
Data Analyst/Data Scientistとして働いていると、ある程度事業が成熟し、データ量が多い世界での仕事が多いと思います。
そんな中、データが核になる新規事業の開発へデータ分析官としてガッツリ関わる機会があったので、そこで得られた知見をざっくばらんに吐き出してみます。
自己紹介
freee株式会社にて、Analyticsチーム統括をしているkotaRofです。
3年ほど前に外資系コンサル会社の分析ディビジョンを退職して参画しました。参画直後の心境はこちらにまとめているので、よければご覧ください。
僕が参画した新規事業の特徴
新規事業と言ってもよくわからんと思われるので、ここで少し状況をまとめてみます。
- 新規事業とは異なる事業ドメインではあるが、利用可能なデータを一定量保有しており、データそれ自体が新規事業の競争力になりそうだった
- データ分析をもとにしたモデルが事業の核(の一つ)になりそうだった
- 実は、「会社が持ってるデータを使えばこんなことできるんちゃうか」と以前から言われていたが、誰も実現できていなかった
- データ分析の理解があるビジネスサイドの人間がいた
改めて書き並べてみると、自分が参画したプロジェクトはかなり恵まれた状況だったと言えます。というかむしろ、これくらいの好条件が揃っていても大変。ですので、新規事業にデータ分析官として参画する際は、状況をきちんと見定めて、「これならいけそうだ」と他ならぬ自分自身が納得し、成功するまで本気で走り続けられるかどうかを検討したほうがよいと思います。
全くうまくいくかわからないものにbetする、というのも一興ですが、めちゃくちゃ条件揃っていてもうまくいかないのが事業開発だ、ということは分析官としても理解した上で臨むべき、というのがこのプロジェクトを経験した上での僕のスタンスです。
知見たちを並べてみる
と、既に得られた知見っぽいものを書き始めてしまいましたが、気を取り直して、次より具体的な得られた知見を吐き出していきます。
周辺領域含めて何でもやる(プロマネ含む)
事業開発やら、ベンチャーやら、何でもやる!というイメージが強いかと思いますが、それはデータ分析官であっても変わりません。
分析やモデリングの要件定義、PoC(実証実験)、モデルの評価、データ基盤構築のプロマネなど、いわゆる通常の分析官として走る際に必要なことと、その周辺領域は何でもやります(というか、他にやる人がいません)。
自分がなすべきことを見定めた上で、分析基盤エンジニアにこういうデータを分析できる基盤を作って欲しい、とお願いしつつ、必要なデータの取得可否を検証しつつ、PoCを回して事業スキームを精緻化しつつ、やっぱりビジネスモデルちょっと変わるから要件再定義しつつ…みたいなマルチタスクを良い感じにスケジュールを切りながら進めるというプロマネ的なスキルが重要だと感じました。
事業会社の分析官としてあまり経験しないことで、かつなかなか良い経験だったなと思うことの一つは、新規事業のスキームに含まれる協力会社との折衝に分析官として伴走することでした。
自社の経営層に分析の結果やモデルを理解してもらうことが事業のGo/NoGo判断に直結するのは当然なんですが、協力会社の対面の方々へ理解してもらい、さらにその上層部の理解(これは協力会社の方が説明する)を得られるような分析アウトプットをスピーディーに出し、ビジネスサイドと並走していく必要がありました。協力会社の方々は当然実際にデータを保持しているわけでもない中で、「こういうデータが出せるのでは」という想像のもと依頼を飛ばしてきます。このような依頼は、一定の割合でトンチンカンに見えたり、期日が異常にタイトに見えたりしますが、これらが必要な理由を理解しながら、より適切と思われる分析や代替できそうな分析への読み替えや、うまく期日を伸ばしたりなど柔軟に対応する必要があるのですが、当該プロジェクトにおいては、分析官のことを理解してくれた上で交渉してくれるビジネスサイド、そしてこちらからの回答に対して協力会社の方々に理解ある対応をいただけたことが大変ありがたかったです。
ハードな仕事の中では、社内外問わずにみんなに感謝しながら互いをリスペクトすることも超大事(これも一つの知見かもしれない)。
みんなのやる気を上げるためにまず作っちゃう
今回の新規事業では、分析に基づいたモデルが核の一つになるものでした。
当然ながらモデルそれ自体を構築するためには一定の時間がかかるため、普通にスケジュールをひくと、事業開発に並行してモデリングとそのブラッシュアップを走らせることになります。しかしながら、並行して走らせているモデリングが成功する蓋然性が低いと、本気で会社も投資しづらいし、ビジネスサイドのメンバーも本気で事業スキームを構築することができません。このプロジェクトのように、『「会社が持ってるデータを使えばこんなことできるんちゃうか」と以前から言われていたが、誰も実現できていなかった』、となれば尚更その傾向は強いです。
そこで今回は、まだ新規事業のプランを練っている段階で、「多分このモデルそのまま使われることは無いが、似たようなモデルを新規事業で使うことになるだろう」と思われるモデリングを勝手にやってしまう、というアプローチを取りました。構築する途中経過を広くアピールしながら走ることで、事業開発メンバーのテンションを上げ(上がったと思う、多分)、経営層を含めて社内のステークホルダーに認知してもらうことで、結果的に新規事業を立ち上げきるための心理的ハードルを多少は下げることができたと思います。
ここでPoCとして作ったモデルはそのまま使わないのですが、本番のモデリングをするときには、あたかも類似プロジェクトを過去に経験しているかのような心持ちで臨めたのは、副次的に得られた、でも無視できないご利益だったとも思います。
スピードと正確さ、説明可能性などのバランスを取りつつロードマップをひく
説明変数や被説明変数、モデルのアルゴリズムなどあらゆる項目に渡り、何をどのように利用するか、という点には任意性があり、この選択や進め方に分析官のセンスが出ます(と私は思っています)。
新規事業開発の場合は、そのものズバリなデータが用意されているわけではないし、本当にうまくいくのか疑問を持っているメンバー・経営層・協力会社の人々を納得させながら進める必要があります。
そのものズバリなデータを貯める仕組みを作り、データが溜まるまで待ってもらったり、他社との提携などにより外部調達するという手段は無くはないのですが、時間・資金などのリソースもかかるし、現行モデルという概念が無いので、それによってどの程度良いものができるのかは正直わかりません。そのような曖昧な状況の中で、手持ちのデータから何らかの近似としてデータを生成するのか、データが溜まる・集めるような仕組みを作るのか、また採用するモデルに関しても、どの程度の精度が必要でどの程度の説明可能性が必要なのかを見定め、うまくフェーズに応じてスタンスを取りながら進める必要があります。
特に、新規事業開発は要件がどんどん変わっていくものだし、プロダクトとして出してからも改善サイクルをどんどん回すものなので、フレームワークを含め、プロダクトの改善サイクルと並走してモデルを将来的に変えていく前提で利用するデータの選定やモデルの構築を行うのがよいと思います。
おわりに
いろいろと書いて、これだけ読むと自分がすげーやつ、みたいに見えてきましたが(笑)、実際は分析やモデルだけじゃなくて様々なハードルがありました(現在もいろいろなハードルと戦っている)。
実は事業スキームの中に凄まじいハックというか発明が含まれていたり、事業担当者のものすごい粘りの交渉があったり、なんやかんやのカオスを体験させてもらい、イチ分析官として大変大きく成長させてもらえたと思います。
この事業開発チームに分析官として入れてもらえたことに大大大感謝です。
ご興味が湧いた方はぜひ弊社の採用情報を覗いてみてくださいね!