どうも。モグリのデータサイエンティストです。
本記事の結論から申し上げますと、データ分析のような知的生産の問題は
・インパクトを生み出せる&検証・証明すべき仮説を立てるまで深堀する(取り掛からない)
になります。
はじめに
機械学習エンジニアの【こんな失敗が嫌だった】ポエム仕立て~失敗談を添えて~
以前こんな記事を書かせていただきました。
ここでは広く「データサイエンス」なんて大きな言葉で表現しますが、
グラフの作成から機械(深層)学習などデータサイエンス案件にちょびっとだけ関わってきた経験のうち
「失敗だったな」と感じたものをピックアップした記事です。
特に手を動かしてから失敗する虚しさたるや・・・
なんとか改善できないものかと色々データ分析の企画系の本も読んでみたりもしました。
ビジネス成果に繋げる本
最近、「イシューからはじめよ:安宅」を読み、
上記を読み、
依頼する側としてとりあえずやってみてを投げない
分析する側としてとりあえず努力して足掻いてみるはやめるべきだと気づきました。
では具体的にどうしたらよかったのか。
本で書かれている事の自己解釈を紹介し、
データ分析のような知的生産の生産性を上げるためのイシュー分析についてメモします。
本で書かれている事の自己解釈
おまけ:本の読書メモ
の順で進めます。
モチベーション
「イシューからはじめよ」はシン・ニホンの安宅さんが約10年前に書かれた本。
サブタイトルに知的生産のシンプルな本質とありますが、データ分析のようにとりあえず分析結果をつくるだけではインパクトにつながらない仕事にとって、参考になる本。
-
第二次産業革命までの**"生産性"**とは、如何に物質的なものを「早く・安く・品質良く・大量に」作るかで評価されてきました。
食品・日用品のように常に需要があり消費される物や、車・家電・エネルギーのように普及している段階にあったからこそ需要の生まれていたものなどです。 -
第四次では、IoTの時代ともいわれるように情報通信の発達により「物質的なモノ」から利用者の行動履歴や関係する種々のデータが取れるようになりました。
-
物やサービスがあふれてくると、データを活用して求められる物を予測・競合に負けている部分・手作業の自動化などで収益を生み出そうとし始めました。
データサイエンス案件はこのような部分に使われているように感じます。
きっと物質的な生産時代にも
「製品にならない無駄な開発」や「企業よがりな売れない商品」
などはあったのでしょう。
データ活用は分析結果が社内公開になるため表立って見えませんが
「無駄な分析報告」や「成果に結びつかない案件」
というものが存在します。
このような呪縛から抜け出せなければ
データサイエンスやAIって金や成果につながらないし、チーム維持の意味ってないかも
と経営陣に思われ無事解体。
なんてことになるので、データ活用のような知的生産のコツを学んでいきます。
本で書かれている事の自己解釈
自己解釈なのでどっぷり私の偏見が入ります。
データサイエンスの企画が立ち上がってしまい、
プロジェクトのリーダーは成果を求められるため
データを活用した何かをしなくてはと考えネタを持っていそうな関係者にヒアリングに回ります。
データの活用に未だ理解の乏しい会社では
「csvデータがあるから、何か示唆されるようなもの見つけて」
「決定木なら寄与度とか出るんでしょ?それで関わり深い変数が見えるんでしょ?」
「物流の配車スケジュールが非効率なんだけど機械学習で綺麗にして」
「店頭商品の売れ行きを知りたいから需要予測して」
のような話が挙がります。
この動き出しでイシューが明確でない事に関わってしまうと、
古い根性論のなんちゃって努力が必要になりコストとエンジニアが摩耗して成果無しに終わることになるかもしれません。
どうしたらなんちゃって努力にならないで案件解決に繋げられたのか、
私は映画好きなので、本で理解したことを映画づくりに例えて表現します。
どうしたら売れる映画が作れるか?
という問いが投げられた。
「流行に乗ってないんだ」とか
「会社のブランド力が弱いんだ」とか
肌感の答えが出され、流行の商品や人物とタイアップすることにお金をかけて
「行動しました!実績です!」と言い始めることになるかもしれません。
まず、何に行動時間を割くべきか(イシュー)を決め、その質(イシューの質)を高めます。
イシューを掘り下げる
原因を探る「なぜなぜ分析」でなく、so what「だから何なのか」を問う
マジカルバナナ的な進め方で何を確かめたらいいのか考える
議論の対象 : 【どうしたら売れる映画がつくれるのか】
→ まず現状、売れていないのか?
→→ BD,DVD化したものまで売れた時に満足なのか
→→→ 目標は何枚で、いくらなのか
→→→→ その目標を目指すのは社名を売るためなのか、経営上お金が必要なのか
→→→→→ 社名が売れたの基準は何か賞を取ることでいいのか?
→→→→→→ その賞を取っている制作会社や監督に共通するものは何か
→ 売れている会社をP社として、P社に比べて何が足りないのか
→→ 営業力か、広告費か、関係会社の数か、脚本か、映画の種類か
→→→ P社と比べて技術力にだいぶ差がありそうでないか
→→→→ 技術スタッフの人数・離職率・機材の充実は違うのか
→→→→→ どれが一番売り上げに効果があるのか?
上記のようにイシューを掘り下げてyes,noや数字を持ってきたら比較できるような状態まで分解します。
これがイシューであり、上記のイシューを疑問文に直して仮説と呼ぶことにします。
とりあえず取り掛かるよりも、検討対象を絞ることができています。
太字にしたいくつかの仮説を、さらに削る & 分解
1つ目・その賞を取っている制作会社や監督に共通するものは何か
2つ目・営業力か、広告費か、関係会社の数か、脚本か、映画の種類か
3つ目・技術力でどれが一番売り上げに効果があるのか?
良いイシューには3つ条件があり、
「意思決定の補助になる・新しい領域に踏み込む(別領域との共通点を見つける)・答えが出る」
1つ目の仮説**"なぜその賞が取れたのか確かめる"は分析対象として難しいと思われます。
その時代の観客の心を掴み、話題になる、審査員の満足を勝ち取る。
イシューとして定義して答えが出るならば大変役に立ちますが明確な答えは出ないでしょう。
これに関わるのは時間の無駄**になりますので捨てましょう。
2つ目の**"P社と比較して何が負けているのか"**
分析は**"比較・構成割合"などを考えて意思決定につなげることが目的です。
結果は意思決定の補助になるでしょう。
しかし、ここで
「営業力なら営業利益を参照したらいいから有価証券報告書を集めよう」とか
「映画の種類ならカウントできるから過去10年の作品を調べよう」とか
とにかく取り掛かろうとすると無駄が発生します
必要なのは一番重要なインパクトにつながる箇所を見極める事**です
抜け漏れなく(MECEに)P社との違いを並べ上げます。
ここで知恵袋的な人に入ってもらえると尚良い。
業界に詳しい人を呼ぶ 等。
さらに細かい3つ目のような技術力に関する仮説がでたとします。
この仮説をさらに分解して、何を調べるか並べます。
「P社の売り上げが上がった年の前後での技術スタッフ数の変化」
「保有機材・レンタル機材の比率」
「撮影スケジュールの必要日数」
等
このデータ収集にもまだ取り掛からずに
・撮影に必要な日数が違うということは、売れるために本数を多く出している?
・本数が多くないならば、編集に時間をかけているのではないか?
のような一段下がった仮説が出てきます。
これらをサブイシューと呼びます。
いくつかのサブイシューが答えの出るもので、改善につなげられる物であれば調査します。
サブイシューの解を集めてまとめた結果、
撮影スケジュールの必要日数に違いがあり、本数は変わらず、技術スタッフが増えた月以降に映画一本当たりの利益が上昇し始めていることがわかった
とすると、
「技術スタッフを雇い入れることが売り上げにつながっているらしい」
という新たな発見に至ることができました。
さらにその理由は・・・とイシューを見つけることを繰り返します。サイクルを高速に何度も回します。
最終的には
【雇い入れた新しいスタッフの活用したい技術が流行を捉えることになっており、現代の観客が見たい物を満たす映画になっていたため利益率が上がった】
となれば、
【新しい技術に興味のあるスタッフの採用を強化すること】が問題解決につながると言えそうです。
売れる映画を作る
という漠然とした一文から、実は映画のプロモーションよりも根底の技術が流行を掴み、
客受けのいい作品・企業イメージになっていたという想像から離れた答えになりました。
上記のようにイシューの流れをストーリーで描き、
それぞれの仮説をどういう結果の図があれば確かめられるかを要所要所で絵コンテのように作図し、
作図したものから何が言えたらいいのか言葉にして残す
データを集め始めるのはそれから。
結論
以上のように、
・インパクトを生み出せる&検証・証明すべき仮説を立てるまで深堀する(取り掛からない)
ことが重要に感じます。
おまけ:本の読書メモ
- 残業しても仕事成果の少ない人に対して、デキるといわれる人はスピードが何倍も速いのか?
- → インプットに対してアウトプット(成果)の割合が大きい = 生産性
- → インパクトの大きい対象を見極められるから時間を無駄にしない
- → 生産性が高く、インパクトのある仕事を「バリューのある仕事」としてココに関わることが重要
- 思考術に関するツール紹介の本が多い
- → カナヅチを持てばすべてが釘に見える
- → ツールは発想のため知っておく&知っている有能・知恵袋な人がチームに入ってくれること
- → ツールに固執するよりもツールを使う対象の質についての議論を重視
- 「イシュー」とは答えを出すべき対象である。生産性に大切なのは、
- 解く対象を見極められること
- 解の質より、まずイシューの質を上げる
- 知りすぎると発想が出てこなくなる
- 速くでなくやる事を削る
- 結果の数字を議論でなく答えが出せるのかを議論する
- イシューと解の質
- イシューの質 とは今解く、検証・証明すべき問題である順位
- 解の質 とは、正確に解ける問題であること
- とりあえず新しい知見を見つけてくれ、とりあえず取っ掛かりやすい所からまず動こう、で結果っぽいものを出せる問題は複数ある
- 根性ですべての問題を解けば質の高いイシューも解けるが、これは根性論。犬の道。時間労働者の考え。
- 知的生産は同じ時間で役に立つ問題を解く。利益率の高い人であることが大切。成果型の考え。
- そのための「解くべき問題を選ぶこと」の選定に時間をかける。
- イシューっぽいものを見つけたら「言葉にする」
- 図やイメージだけで始める場合は手戻りやチーム内での誤解が生まれる
- EDAを行い作図するのは発想を生み出すには良い手法だが、
- やはり概念は言葉にすることでしか伝わらない
- 言葉にすることで、何を結果から言えたら成功か。が考えられるようになる
- 良いイシュー3条件
- 1.本質的な選択である(答えが出ると大きく進展する)
- 科学研究にはココが明確である場合が多い
- コレを証明できれば次に確かめるべき問題が狭くなる 等
- ビジネスでは見えていないこともあるし、立場や人によってイシューと感じるかどうかも異なる
- 2.深い仮説がある(常識を覆す・新しい発見につながる)
- とりあえず確かめるわけでなく、新しい領域だから網羅的に調べる事にも価値がでる
- 科学者も成果につながると確信した実験を積み重ねてノーベル賞にたどり着いている
- 3.答えを出せる(そもそも答えを出す手法が存在する)
- 現状で情報を集めることができない、解く方法が整っていない問題には関わらない
- 研究なら数百年後に役に立つかもだが、ビジネスは答えを出す時間が限られている
- 情報は一次情報として生のデータ・生の話を聞きに行く
- 情報は調べすぎない。未知の分野は6,7割までは素早く学べる
- 1.本質的な選択である(答えが出ると大きく進展する)
- どうしてもイシューを定義できない
- 考える対象を絞る
- 問題の関係性を視覚的に表現する
- 解決像から現在の状態のギャップを逆算する
- 問題文を言い換えて解ける仮説と解くべき仮説を確かめる
- 極端に改善した場面を想像して一番改善率が高そうな部分を対象にする
- イシュー分析を行う
- 1.分析・検証のストーリーラインを考える
- まずMECEに分解する。フレームワークでイシューを細かいイシューに分ける
- 細かいイシューをサブイシューと呼び、サブイシューごとに検証していく
- サブイシューごとに仮説と言いたい結果が存在する状態
- 映画は場面が面白くても前後の流れが大切である
- 2.具体的な絵コンテを描く
- 分析過程を絵コンテにする
- とりあえずで取り掛からない
- 特に重要なサブイシューから取り掛かることで、サブイシューの設定が間違っていなかったかを早く確認できる
- 分析過程や発生する結果に意味があり、結果が出なくても役に立つイシューを選ぶ
- 思っていた結果が出ないと何も進まないイシューから取り組むのは時間の無駄
- 1.分析・検証のストーリーラインを考える
- 分析は「求めたい解を出したい自分」と、「それが偏見であるかもしれないと疑う自分」の両面でフェアに分析する