次世代データサイエンティストが身につけるべき4つの最重要スキル
- 4 Skills the Next Generation of Data Scientists Needs to Develop - リンク
データサイエンスやデータ分析プロジェクトが成功するかどうかは、データからいかにワクワクする知見が得られたかとか、いかに最先端の手法を使って分析したかはあまり関係がありません。
むしろ、ビジネスのドメイン知識を持っているか、ビジネスが抱えている問題意識を共有できているか、データからわかったこと、わかってないことを明確にビジネスの言葉で伝えられるかといったことが非常に重要です。
このことに気づけないと、せっかく頑張って勉強し、さらに時間をかけて様々な角度からデータを分析したとしても、その仕事は相手に適正に評価されず、そのことに失望してしまうことになりかねません。
そこで、今回は最近ハーバード・ビジネスレビューに出ていた、「次世代データサイエンティストが身につけるべき4つの最重要スキル」という記事をみなさんに紹介したいと思います。
この記事の中では、データサイエンスまたはデータ分析プロジェクトを成功させるためには以下の4つのスキルが必要だとされています。
- 問題の本質を見極める力
- 明確に、そして具体的に問題を定義する力
- 進捗を共有し、管理する力
- 解決案とその根拠を伝える力
これらはどれもデータ分析の手法やアルゴリズムとは直接関係のない話ですが、プロジェクトを成功させるためにはどれも重要なスキルだと思います。
以下、要約。
1. 問題の本質を見極める力
データ分析を行うリーダーはビジネスにおける様々な業務を最前線から見ることができます。こうした機会は既存の問題を解決したり新しい問題を見つけたりするために必要な視点を与えてくれます。
1つの事例を見てみましょう。
あるホテルチェーンでゲストリレーションを担当する部署のトップは上層部のマネージメントより、彼らのホテルのゲストのチェックインに対する評価が低いことに対して厳しい指摘を受けていました。
ゲストへのアンケート調査の結果によると、このホテルのチェックインのプロセスはうまく管理できておらず、時間がかかり、快適な体験を提供できていないとのことでした。マネージメントチームはさらに、チェックインに関して低い評価を下したゲストがホテルを再利用する可能性は低いということも発見しました。
ゲストリレーション部はチェックインに関して根本となる問題を探し出すためにデータ分析チームに連絡しました。しかし、ゲストのデモグラフィック(年齢、性別、経済的背景など)や、どういった部屋を希望していたのか、どこでチェックインしたのか(フロントデスク、自動マシーン、モバイルなど)、チェックインの時間や時期、ゲストのロイヤリティ・プログラムのステータスなど、ありとあらゆるチェックインに関するデータを調べたのですが、それらしい原因を掴みだすことはできませんでした。
そんなとき、ある従業員が定期的に実施している顧客アンケートにある自由記述の回答を見てはどうかと提案しました。テキスト分析のテクニックを使ってテキストデータを分析した結果いくつかのテーマが現れてきました。それはホテルのインフラが最適でないというものでした。例えば、インターネットにアクセスするためのWi-Fiの設定がうまくいかない、部屋のカードキーがうまく動かないことがある、部屋の家具が壊れている、部屋がきれいでない、などです。
こうした問題はチェックインとは直接関係のないものです。しかし、ゲストにとってはこうした問題はチェックインのプロセスに関係する問題として記憶しているものだったのです。結局、問題はホテルの管理であって、チェックインのプロセスではなかったのです。
ほんとうの問題を的確に見極めるためには、目の前にあるデータを見てるだけではなく、大きな視点を持って問題を様々な角度から注意深く調査し、本質に迫っていかなくてはいけないということです。
2. 明確に、そして具体的に問題を定義する力
問題が認識されたら次はその問題を定義する必要があります。
その問題の性質とそれをデータ分析がどう解決できるのかに関して明確にしなくてはいけません。ビジネスリーダーは漠然とした懸念や問題意識をデータチームに投げかけてくることが多いからです。
例えば、顧客マネージメントの仕事をしていたとして、どの顧客がNPS(ネットプロモーター・スコア)で低い評価をする可能性があるかを見極め、早めに対処することでそうした事態を避けたいというケースを考えてみましょう。
それなりのデータサイエンティストであれば、この問題を解決するためにはどういったデータが必要となり、どういったデータサイエンスの手法が使えるかすぐにわかります。
しかし、実際にはビジネスリーダーがこのように話すことはありません。
例えばこんなかんじです。
「顧客満足度の目標達成の見込みが厳しいので、私達のGo-to-Market戦略を見直す必要があるかもしれないんだ。もしかしたら見込み顧客のパイプラインに関する問題かもしれないが、まだこれに関してのアライメントがとれてないんだよ。私達が見てる方向が間違っているのかもしれないが、今はとにかく誰をターゲットにし、なぜそうなのか見極める必要があるんだ。データを使ってこの問題を解決できる?」
そこで、データサイエンティストであれば誰もが問題を明確にするためにいくつかの質問をしていくことになります。例えば、「アライメントとはどういうことですか?」、「顧客満足度はどのように定義し、計測しているのですか?」、「私達が成功している、またはそうでないというのはどういった指標によって測っているのですか?」といったような質問です。
データ分析プロジェクトの成功のためには、少しづつ情報を引き出すということを繰り返すことによって、ビジネス担当者の頭の中にある問題をデータ分析やアナリティクスによって解決できる問題として言語化し、的確に定義していくということが重要になります。
そのさいに、以下のような質問が役立つことでしょう。
- 何が私達が解決しようとしている問題なのか、それを正確に言い表すとしたら?
- その問題が実際解決されたとき、それはどういった結果として認識されることになるのか?
- その問題を解決するために理想的にはどういったデータが必要なのか、実際手に入るデータは何なのか?
- データ分析が問題の解決に対してどう役立つのか?
こうした場面では、私はビジネスチームと「What-IF(もしこうだったらどうなる?」という一連の問答を繰り返します。
「もし結果がこうだったら、またはこうでなかったらどうなるのか?」
「そうした結果を得ることによってあなたがより良い意思決定を下すのにどう役立つのですか?」
といった具合にです。
ただ、ビジネスリーダーはしばしばこうした質問を避けようとします。まずデータを分析し、何か出てきてからそういう話をしようと言ったかんじです。しかし、これは典型的な間違いです。分析がどう問題の解決につながるかをはっきりさせることなしに、分析計画をたてることはできないからです。
問題をデータ分析で解決できる問題として明確に定義するために、データリーダーには高いコミュニケーションスキルが求められます。ビジネスリーダーと問題について議論し、理解し、そして言語化することで、ビジネスにとって意味のある貢献をするために必要なデータやデータ分析の手法を決めていくことができるようになるのです。
3. 進捗を共有し、管理する力
問題を認識し、さらに定義した後、多くのデータ分析者は自分たちの部屋にこもって分析し、何らかの答えや解決方法が見つかったときにだけ出てくるという傾向があります。こうしたアプローチはとても問題です。もっと効果的なやり方は、情報をもっと積極的に共有していくことで、的確な期待値を設定していくことができるようなプロセスを作ることです。
データリーダーは、完全な結果がでるまで待つのではなく、まだ早いというときでさえ分析の途中結果をビジネスチームと共有していく習慣をデータチームがつけるようにしていくべきです。
ビジネスチームとやり取りするたびに、貴重なフィードバックを得ることができます。例えば、この分析結果はビジネスチームにとって意味のあるものなのか?私達は正しい言葉やコンセプトを使っているのか?ということをプロジェクトが終るまで絶えず確認していく必要があるのです。
データサイエンティストの中にはこうしたアプローチに反対する人もいるでしょう。彼らは自分たちの作ったモデルや自分たちの創造的なソリューションやテクニックに魅了され、自分たちが納得できるものになったときにそれらをセンセーショナルなものとして発表するのを楽しみにします。しかし、こうしたセンセーショナルなものを発表するというのは、後になって火を吹いてしまう可能性のある悪い慣習です。
プロジェクト期間の最後に行われるプレゼンテーションで伝えられる大きな驚きを持つような発見は、見ている人たちを警戒させることになります。というのも、そもそも驚きを持つような発表を目にすると、見ている人たちはその元となるデータや使われた手法がおかしいのではないかと疑ってしまうからです。
全てのデータを元にしたモデルは何らかの前提を抱えているものです。欠損値や外れ値をどう処理したのか、どのような計算処理を行ったのか、なぜそのアルゴリズムを選んだのか、など。
もしデータチームが自分たちの分析結果をビジネスチームと頻繁に共有し、自分たちの前提を確認していかなければ、ビジネスチームは最後の発表の段階になってその分析結果における些細な点に対してあれこれと文句をつけることになるでしょう。逆に、ビジネスチームを分析における意思決定プロセスに常に巻き込んでおけば、最終結果に対する彼らの賛同と信用を前もって得ることができるのです。
私がこれまで話してきた多くのビジネスリーダーが言うのは、データ分析プロジェクトにおけるベストな最終成果物はサプライズのないものだと、ということです。
4. 解決案とその根拠を伝える力
最後に、問題解決のためのソリューションの話をしましょう。データリーダーとそのチームがこれまでの3つのステップをうまくこなし、有用な答え、発見、または問題解決のためのソリューションが見つかったのであれば、それらをどのようにビジネス側に伝えるかが重要となります。伝えたい相手に理解されるのはもちろん、それが行動に移せるものであるということも重要です。
これはデータを分かりやすいように可視化して見せるということだけではありません。データから得られた知見であれ、モデルによって推奨される新しい施策であれ、そうしたソリューションはビジネスチームが使う言葉で表現される必要があります。
そこで私が推奨したいのは、問題解決のために最も重要な部分をハイライトした2ページに渡るデータ分析メモです。2ページにまとめるのはすごく密度の高いものになるように聞こえるかもしれません。データチームがまとめる一般的な長いレポートに比べると、たしかにそうかもしれません。しかし、ここでのポイントは簡潔さです。
2ページという制限をつけることで、行ったデータ分析の詳細についてだらだらと説明したくなる誘惑をおさえることができますし、データから得られたインサイトを元にした提案とその根拠を明確にしなくてはいけないというモチベーションが働きます。
以下のポイントが明確にそして簡潔に書かれていると良いでしょう。
- 解決された問題、または質問を提示
- 元の問題 / 質問に対する提案や答えを提示
- 提案や答えの根拠を説明
- 分析する際の前提となっているもの、重要となる注意点を共有
- 使われた分析手法の要約、ハイレベルのみ。詳細を提示する必要があれば、それは別のレポートで。
もちろん、こうしたことを推奨するのは私だけではありません。Amazonの創業者であるジェフ・ベゾスは会社の幹部たちに提案や報告内容を、パワーポイントではなく、6ページを超えない程度にメモとして簡潔にまとめることを求めることで有名です。
まとめ
データリーダー、そしてデータチームはコラボレーションとコミュニケーションにフォーカスするべきです。そうすることでより広い役割に精通し、本質的な問題に気づくことができ、問題の性質と重要性を定義し、定期的なアップデートを通して分析の過程をうまく管理できるようになり、ビジネスにとって役に立つソリューションを相手にしっかりと伝えることができるようになるのです。
要約、終わり。
あとがき
データサイエンスやアナリティクスと言うと、ついつい様々なアルゴリズムやデータ分析手法を広く深く知っていなくてはいけないと思いがちですが、ビジネスの問題を解決、より良い意思決定を行えるようにするという文脈では、実はそんなことはありません。
もちろん必要最低限の知識やスキルは必要となりますが、それ以上に重要なのは本文でも触れたようなコラボレーションやコミュニケーションといったいわゆる「ソフトスキル」だったり、ここでは触れられていませんが、業務におけるドメイン知識、当事者としての問題意識、仮説設定能力だったりします。
特に、本文で出てきた3番目の最新状況をまめに報告するというのは、データ分析プロジェクトに限らず、どんな仕事でも依頼されているからにはとても重要なものです。日本では「ホウ・レン・ソウ」という「報告、連絡、相談」を意味する便利な言葉があります。まさにこれができているかどうかで、最終的に相手に信頼されるか、そしてビジネスの改善という観点において、分析プロジェクトは価値を提供できているのかを左右することになります。
こうしたスキルや能力は教科書を読んだり、講習を受けたり、自分ひとりでこもって勉強できるようなものではありません。実際にプロジェクトを行いながら上達していくものなのです。そのさいにしっかりと上記に挙げられたようなポイントを意識し、練習しているのだという姿勢で望むことで確実にスキルアップしていけるものです。
そしてこうした能力こそが、今のようなChatGPTを含めAIが当たり前になった時代に、人間に最も求められているものなのです。
以上。
データサイエンス・ブートキャンプ・トレーニング
次回のデータサイエンス・ブートキャンプは12月、東京です!
データサイエンス、統計の手法、データ分析を1から体系的に学ぶことで、ビジネスの現場で使える実践的なスキルを身につけたいという方は、ぜひこの機会に参加をご検討ください!
ビジネスのデータ分析だけでなく、日常生活やキャリア構築にも役立つデータリテラシー、そして「よりよい意思決定」をしていくために必要になるデータをもとにした科学的思考もいっしょに身につけていただけるトレーニングとなっています。