データ分析
DataScience
データサイエンス
スタートアップ

あまりにも多くのスタートアップがデータ分析するときに犯す4つの失敗パターン

toa-heftiba-195458.jpg

ホテルを直前に予約する時に人気のあるHotel Tonightというサービスを提供しているスタートアップがこちらシリコンバレーにあります。そこでデータ分析のチームを率いているAmanda Richardsonが、スタートアップがデータを使うときによく犯す間違いをこちらの"The Four Cringe-Worthy Mistakes Too Many Startups Make with Data"という記事の中で4つにまとめていますが、今日はそちらを紹介したいと思います。これらはもちろんスタートアップに限らず、どのようなサイズの会社でも、とくに新しいデータ分析のプロジェクトを始める時によく見られる失敗パターンだと思いますが、こちらの記事では間違いだけでなく、逆にこうすればいいという提案も最後にわかりやすくまとめられているので、是非参考にしてみて下さい。

それでは、以下抜粋です。

間違い1:ゴール(何を達成したいのか)でなく指標から始めてしまう。

ほんとによくあるのですが、多くのチームが、しっかりと筋の通った計画をもたずに、リアルタイム分析やデータレークといったジャングルの中で目的を見失ってしまい、特に目的があるわけでもなくただデータを堀りだして、何かストーリーを探し出すのに時間を費やしてしまっています。そうではなく、調べる必要のある具体的な質問や仮定から始めるべきです。

製品をリリースすると、多くの人は、”調子はどう?”といった曖昧な質問をします。そうではなく、私達の製品のリリースの目的は何なのかを明確にすべきです。例えば、それはコンバーションを上げることなのかもしれませんし、顧客の入ってくるトップ・ファネルを増やすことなのかもしれませんし、ボトム・ファネルを動かすことなのかもしれません。または、一ユーザあたりの売上を伸ばすことなのかもしれません。

こうした問題に対応するために、アマンダは次の提案をしています。

まずは、プロジェクトのゴールを紙の上に書き出すことで、やっているうちにそれがぶれないようにします。全ての新しいプロジェクトが始まる前にこれをやるべきです。昔からある、SMART(Specific/具体的, measurable/計測可能, achievable/達成可能, relevant/意味がある, and timely/時間の指定)というフレームワークを使うといいでしょう。そして、うまくいってるかどうかを判断するためのスコア・カードを作ります。

だれもが自分たちを褒めたいという願望があるので、データを見た後でその中から自分たちに都合のいい指標を見つけてきてしまうものです。例えば、最初は自分たちのゴールは新規ユーザーの数を10%伸ばすことだったはずが、そのかわりにリピート・ユーザーが使う回数が30%伸びていたとすると、急に私達は“リピート・ユーザーが30%成長した!”と喜んでしまいがちです。こうして当初のゴールを見失ってしまうわけです。

データを扱ってる人に、ある製品やフィーチャー(機能)の調子はどうなっているのかという質問をすると、大抵の場合、たくさんの興味深い”インサイト”が答えとして帰ってきます。しかし、最も気にすべき重要な指標がこうした副次的な情報のせいで曖昧になってしまわないように気をつけるべきです。

この四半期の最も重要なゴールを考えてみて下さい。簡潔に定義された指標を持っていますか?

間違い2:パーソナライゼーションの横行

ユーザーは今までの参照履歴から何かをレコメンドされるのを期待しているのではなく、時、場、目的をわきまえたレコメンドを期待しています。ですので、意味のあるレコメンデーションなどといったパーソナライゼーションの機能は作るだけでものすごく時間もかかるし、ものすごい量のデータを必要としますが、スタートアップは特に最初の時期はこうしたものを持っていないものです。

写真のストリームを提供しているようなサービスであればこうしたレコメンデーションは早い時期に作る必要があるかもしれませんが、B2Bの経費精算のサービスを作っているのであれば、パーソナライゼーションが必要になることはまずないでしょう。

間違い3:専門のデータサイエンティストを雇ってしまう

データサイエンスとは独立した仕事ではなく多くのスキルを集めたものです。分析や戦略が独立した仕事ではなく多くのスキルを集めたものなのといっしょです。チームの全ての人間が戦略的であるべきで、全ての人間が分析(データに限らず)することができるべきです。

Hidden Figures(邦題:ドリーム)という映画を見た人ならば知っているかもしれませんが、昔、NASAで有人宇宙飛行計画のミッションに参加していた女の人達はコンピューターと呼ばれていました。当時は限られた専門の人のみがコンピュータを使って計算処理を行うことを仕事としていました。もちろん、今では誰もがそうしたことを行い、誰もが持っているスキルの一つです。つまり、そうやって世界は進化していくものです。現在のデータサイエンスはまさにそうした局面にあると思います。

もっと多くの人がデータを使って意思決定を行うことができるべきですし、そのことに責任を持つべきなのです。

よくある間違いは、技術はあるがビジネスのセンスが全くないデータサイエンティストを雇ってしまうことです。そして、そうした人たちをビジネスに関するディスカッションが普段行われている場所から隔離した上で、彼らにたくさんの質問を次から次へと浴びせてしまうのです。こうした環境では、どんなにスキルのあるデータサイエンティストでも成功できません。こうして、彼らの行う分析の結果や提案が、机上の空論か意味のないものとなってしまうのです。

さらに、そうしている間にたくさんの優れたビジネスに関する質問は待ち行列に埋もれてしまっています。多くの人がデータサイエンティストの人たちの空き時間を待っていますが、そうではなく、どうやってこの質問に対する答えを自分で探し出せるのか?という風に考えるべきです。すべての人がデータ分析ができるような教育を受けて、それがサポートされていると感じることのできる環境を作ることで、あなたの組織はもっと向上することができるのです。

間違い4:最新のツールのおっかけ

データの世界は特に進化が早いので、毎日のように新しい技術、製品、ツールが出てきますが、Amandaは、それらを追いかけ続けるのではなく、全てのデータチームが彼らの組織に提供すべき3つのシンプルなものを提案しています。

一つにまとまったダッシュボード

すでに述べましたが、最も重要な指標、誰も変えることのできないゴールに基づいた指標をダッシュボードに載せるべきです。これはどんなフォーマットでも構いません。それこそGoogle Docのドキュメントでもいいのです。組織の全ての人が見える形で定期的に提供するというところに意味があります。

アクセスすることのできるデータ

もしあなたのチームの全ての人たちにアナリティカル(分析)な思考ができるようになって欲しいのなら、彼らが簡単にデータにアクセスできる環境を用意するべきです。マーケティング担当であれば顧客の属性に関するデータかもしれませんし、製品担当であればユーザーのコンバーションに関するものかもしれませんし、またエンジニアリング(IT)担当であればサーバーの稼働時間に関するものかもしれません。

フレキシブル(柔軟)なツールセット

一つのソリューションが全ての問題、全ての人にとって十分ということはないので、柔軟にそれぞれの人が仕事をしやすいツールを使わせるべきです。


以上が抜粋となります。

どうでしょうか?みなさんも、データ分析に関するプロジェクトでこうしたことを経験したことがあるのではないでしょうか。私自身もこうした場面に遭遇したことが多々あります。特に最初の間違いとして挙げられている、プロジェクトもしくはチームの本来のゴールが定まってないがばっかりに、データの中から”興味深い”インサイトを次から次へと発見しては、なんとなくデータ分析をした気になってしまう、つまり、なんとなくわかったような気になって終わってしまうというのは、よくあるのではないでしょうか。

これでは本来のビジネスの改善に結びつかないということもありますが、もっとまずいのはこうしたことによる、データ分析に対する失望と不信感を組織の中に生み出してしまい、データによって裏付けされた意志決定をしていこうとする文化を作るチャンスを逃してしまうことです。しかし、特に現在のように、データの使い方がうまいシリコンバレーや別の地域の企業と戦っていかなくてはいけない日本の企業にとってはこうした間違いを犯す余裕はないのではないでしょうか。

まずは、ゴール、もしくは解決したい問題を明確にし、シンプルなかたちで誰にでも理解できるように書き出し、それを解決するための本当に有効な指標というものをデータを分析した上でしっかり定義し、さらに そうした指標によって浮かび上がってくる問題の要因、もしくは指標そのものを改善するための対策を探すための分析 をデータサイエンスの様々な手法を用いて行っていくことで、一歩一歩着実にビジネス自体を前に進めていけるのではないかと思います。流行りではなく、地に足の着いたデータサイエンスを行っていくことで、長い目で見て、データに基づいた意志決定を組織の文化として定着させることが今まさに求められているのではないでしょうか。


データサイエンスを本格的に学んでみたい方に

手前味噌になりますが、この3月の下旬に、Exploratory社がシリコンバレーで行っているトレーニングプログラムを日本向けにした、データサイエンス・ブートキャンプが東京で行われます。データサイエンスの手法を基礎から体系的に、プログラミングなしで学んでみたい方、そういった手法を日々のビジネスに活かしてみたい方はぜひこの機会に参加を検討してみてください。こちらのホームページに詳しい情報があります。