LoginSignup
3
0

More than 3 years have passed since last update.

スタートアップでデータ分析(あるいは集計)をするということ

Last updated at Posted at 2020-05-04

はじめに

こんにちは。@pp_ykykです。
現在スタートアップにて、データ分析兼エンジニアをやっております。
創業間もないスタートアップで、データ分析(あるいは集計)を頼まれたときに気をつけていることをまとめました。

想定している読者

  • データ分析をやろう(もしくはやって)と言われたが、社内にそれっぽいことをやってる人もチームもいない人
  • エンジニア・マーケターだが、そろそろなにがしかのデータをみたいと思い始めた人

ターゲットじゃない読者

  • データ分析の実践例・機械学習のプラクティスを知りたい人
  • 整えられたデータが会社・チームにもうあるのでどうやって使えばいいのか探してる人
  • 分析基盤のDevOpsを学びたい人

これをやっとけ

大事なことは2つです。「データに責任を持つこと」「出したデータを価値につなげること」

「データに責任を持つこと」

  • 属人的でいいからデータの性質に詳しくなれ

再現性はもちろん大事だけど、自分一人でデータの取り込み、整頓、集計、(可視化)できる。どんなデータが存在してるのか語れる。

  • 定義とゴールを明確にしろ

何のために、どんなデータをいつまでに出すのか?社内で完結する分、曖昧になりがちです。また、依頼者も雰囲気で頼むということはよくあります。

「出したデータを価値につなげること」

  • とにかく早く形にして、他の人のフィードバックを受けろ

「データによって何らかの結果が出る」までには時間がかかります。結局何ができるの?と言われる前に最速でアウトプット出すのが大事。(完成度はおいおい上げていきましょう・・・)

  • セキュリティとかOpsとか不安になってきたら巻き込め

一人だけでやってると落としがちになります。社内データ基盤作成という一大プロジェクトにしたいのであれば、他の人を巻き込みましょう。

1. 属人的でいいからデータの性質に詳しくなれ

スタートアップでは、プロダクトの成長スピードに重きを置かれている場合が多いと思います。
データベースの構造や、スキーマ定義、ビジネスロジックなどもドキュメント化をすっ飛ばしてリリースされることもあるでしょう。
先週までこんなテーブルなかったよね?とか日常茶飯事です。

  • このテーブル・カラムって今も使われてるの?
    • もちろん全てを把握するのは難しいですが、主要なデータについては語れることが大事
  • データの特性、StateをあらわすのかLogをあわらすのか
    • この辺は別記事で解説します!

この2点は必ず押さえておきましょう。

2. 定義とゴールを明確にしろ

データ集計を依頼された、もしくはやってみたいという際に陥りがちなのが、「アウトプットイメージの要件決め」を行なっておらずになんとなく終わってしまうことです。依頼者もあやふやなニュアンスでオーダーを出してしまうことがよくあります。

「ユーザのログイン率を出してくれ」と言われたとしても、複数端末でログインしてたら、セッションは存在したが3秒でアプリを落としたら・・・など無数に考えることがあります。

  • 依頼内容の整理、それを表現するためにどのようなデータが必要かを洗い出す
    • そもそも依頼者と認識にギャップがあるというパターンは意外とあります。
    • データの抽出結果は、今回だけでいいのか。毎月見るのか。頻度も大事。
  • データの不足がおきた時に、プロダクトの開発者と協力する
    • スタートアップでは、データがそもそも存在しないというパターンが大いにあります。

依頼に応じて最適だと思われる定義を策定し、それに応じたデータを抽出することが大事です。

3. とにかく早く形にして、他の人のフィードバックを受けろ

2とも近い話ですが、自分も依頼者もまだ未熟な場合、出したアウトプットがイメージと違ったということは存在します。
また、「データ分析」自体の価値がまだ会社・チームに浸透していない場合もあるかもしれません。

こんなことができるよ。こんな示唆がうまれるよ。に関してはいち早く他の人に共有して、ビジネスとしてどう役立てるか、デザイナー・エンジニアにとって価値が提供できたかを常に意識することが必要です。

未熟であればあるほど、早くアウトプットをだして、ギャップをうめるリードタイムを短くすることが大事です!

4. セキュリティとかOpsとか不安になってきたら巻き込め

データ分析もある程度サイクルが回ってきたら、「このデータって社内に公開されてていいんだっけ?」「毎週同じようなオーダーがくるな」といったフェーズに達してきます。
とにかく早く出すことが大事と上でいいましたが、セキュリティリスク・技術的負債を抱えたままスケールすることはできません。

SREや情シス部門、プロダクトの開発者をうまく巻き込んで、会社としてのプロジェクトにすることが大事です!

まとめ

自分自身、データウェアハウス・社内BI環境の構築、データ集計・分析、プロダクト開発など様々な仕事に携わってきましたが、「データを集計すること」だけで価値を生み出せることは稀です。
ただの「データ集計する人」ではなく、「定量的なデータを元に、ビジネス・プロダクトに価値を提供できる、新しい視点を与えることができる」ことを目指して頑張っていきましょう!!

3
0
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
0