1.本投稿の目的
- 書籍を読んだ感想・学びの「言語化」
- ↑による「記憶の定着」
- ↑による「仕事への活用」
- たまには息抜き
2.書籍の共有
『データサイエンティストの要諦』 新書 – 2021/4/30
加藤 良太郎 (著), 高山 博和 (著), 深谷 直紀 (著)
本書籍の目次
- 注目度を増す「データサイエンティスト」という職業
- データサイエンティストは「分析」だけできても意味がない
- データサイエンティストの市場価値を高めるコンサルティング能力
- 新たな事業戦略の提案で顧客の課題解決を目指す
- これからのデータサイエンティストはどうあるべきか
本書を一言で表すと(私見)
「ただのDSでない、”価値あるDS”になるために読んでおくもの。」
3.感想・学び
以下「200字感想」「印象に残った箇所3選」「+α・疑問」の3つで本書の感想・学びを言語化してみる。(読書感想文ってどんなふうに書いてたっけ…)
200字感想要約
現在DS系の職種を目指して転職活動を行っている自分にとって、まさに「今読んでおいてよかった本」だった。3年前の書籍だが、本書が示す「あるべきデータサイエンティストの姿」はまさに現在様々な企業から求められている像で、それはやはり「コンサルティングができるデータサイエンティスト」である。同時に、その社会的価値とビジネス的な価値を同時に感じ、より自分の目指すベクトルを言語化してくれる材料になった。
印象に残った箇所3選
特に印象に残ったフレーズと自身で考えたことをメモする。
①DSがあるべき姿になるため必要なもの
まず本書では、データサイエンティストのあるべき姿を以下のように定義している。
データを分析した結果から得られるインサイトをもとに経営や事業に資する判断を行い、新規事業立案や業務改善などの施策を提言し、必要に応じて構築したモデルをシステム化し運用に乗せること
ここまで明確に&丁寧に説明をしているのは、DS=「モデリングのみ行う職種」だと誤解されやすいからだと感じる。これはこの本が出版された3年前よりは前進している状況かも知れないが、事実私も転職活動を進める中でさまざまな種類のDS職を見てきた。
そして、ここに必要なものは以下だ。
アナリティクス=「①課題の抽出・設定」「②データ分析」「③分析結果の活用」を1人で遂行できる力
ここに関しても世間で"アナリティクス"=「分析」「解析」と言った意味で捉えられがちだが、それではただの「モデリング屋」で、①③の前後を以てして初めてクライアントの役に立ち、今後も明るい「データサイエンティスト」になれると述べている。(本書では、この「モデリング屋」という言葉を主張の裏返しとして多く使っている)
この2つを合わせてデータ分析を考える…というのは、「理屈では当たり前だが実践するのが難しい」 のではないかと感じた。
「課題設定」なんかは、ビジネスの世界ではどの職種でも大事な考えのように思える。ただ、「これを日々できているか?」と聞かれると、どれだけの人間が胸を張ってYesと答えられるだろう…少なくとも私はできているところとできていないところが明確に思い浮かぶ。また、仮に課題設定をしたとしても、「それは適切な課題なのか?それは本当に課題なのか?」という問題もある。
これがデータサイエンティストにとっては非常に大きな問題かつ重要な意識になっており、この前後のフェーズによって価値が決まるというのは間違いないと私も感じる。それは今後モデル作成・データ分析はどんどん自動化が進むという現状と、コンサルティングによりスピード感を持たせるという目的もあるように感じる。
だからこそこの「課題設定」「その後の活用」を”当たり前のように行う”段階まで持っていくことが重要なのかもしれない。
②DSに必要なコンサルティング能力
ここでは上記①「あるべきDSになるため必要なもの=アナリティクス」を、「コンサルティングスキル」としてより詳しく言語化している。
データサイエンティストに必要なコンサルティングスキル
①クライアントの現状を把握し、目指す姿を明確にする
②目指す姿に進むための実行計画を策定
③クライアントの進行と実行計画のずれを是正
④必要に応じてAI,BIツールを準備・導入・実行
④はモデリング屋にもできるが、DSには①〜③を行うコンサルティングスキルが必要なのだ。それはまだ経験に乏しいクライアント等が「明確な課題を持てていないこと」「実は課題設定を間違えていること」があるためだと捉えている。データ分野でクライアントのちからになるために”モデリングスキルだけ”を高めるという世界はまだ早いという見方もできるのかも知れない。(おそらくそんな世界は来ないと思うが)
ここで③に「是正する」という考えがあるが、これは 「プロジェクトを推進する力」 とも言い換えられそう。プロジェクトのなかには実行計画がなかなか上手く進まないときも必ず出てくる…。そのなかで、新たな提案ができるか?ふさわしいゴールを再設定できるか?といったところに、データサイエンスの知見とそれを調整するコミュニケーション力が必要ということだろう。
③グレードアップのための重要な考え方
本書では、1つの「次世代DSのスキルとキャリアパス」例として、6つのスキルと4つのGradeを図示している。この場で図の共有は省略するが、そのうしろに「グレードアップのための重要な考え方」というのがある。
成長が早いデータサイエンティストが心がけていることがあります。それは考えるステップと実践するステップをしっかりと分け、考えるステップに時間と労力をかける習慣を身につけることです。
これはいわゆる「個人の成長戦略」と言えるように感じた。
個人が成長できる重要なキーが「考える」ということ…データサイエンスという領域に関しては特になんだか意外なようにも思える。もちろんモデリングの知識やドメイン知識は必須だが、プロジェクトの進め方や考え方の多くはOJT中心に学べると考えていた。事実、DS職は専用の研修を用意している会社が少ないように感じている。
ただ、手を動かすことで身につけられること・経験を積むことで得られるものを否定しているわけではないと思う。それは当然とした上で、しっかり別枠として「考えろ」ということだと解釈している。上記で述べているようにやはり土台はコンサルティングスキルにあり、そうなると「プレゼンテーション」フェーズが重要で、その場面での成長差が生まれるということだろう。現職でもプレゼンはよく行うが、確かにそのときに「考える」と「手を動かす」を混ぜてしまうと効率が悪くなることは身をもって感じたことがある。
この「考える」も習慣づけの1つだと思うし、意識して行うことに意味があるように感じる。
+αで考えたこと・疑問
2024年現在はどうなっている?
本書では「2〜3年後に起こりそうなこと」として「データサイエンティストのフリーランス化が進む」、「5〜10年後に起こりそうなこと」として「機械学習の陳腐化」と予想されている。
出版された2021年から3年経ったが、いかがだろうか。
まず、前者の「フリーランス化」予想はかなり当たっているように感じる。わかりやすいところでいうと、DS関連の情報を発信するインフルエンサー・Youtuberが増えている現象だろう。正確にいうとデータサイエンスをフリーランスとして行なっているわけではないが、データ活用職種の幅が広がってきている証拠だと思う。現在通っているオンラインスクールもデータサイエンスに絞った特徴があり、講師陣としても様々な形態の方がいる。
一方「機械学習の陳腐化」について、私はわかりかねるところが多い。もちろん現職がそうしたIT分野に特に遅れているからというのはあるが、転職活動の一環で企業分析をしてもやはり機械学習を組織内で積極的に取り組んでいる企業は少ないからだ。これは中小企業だけでなく、いわゆるJTCでも無関心なところが多くないだろうか。
また経営陣が関心を持っているとしても、個人というレベルで「うちには関係のない領域だ」「私はやらないこと(やれないこと)だ」と割り切っている人間も多いのでは?という仮説を持っている。
本書の著作陣の「データ活用先進国にしたい」というビジョンに私も強く共感するが、現社会を構成する個人レベルをミクロで見たときに、より多くの課題があるように感じる。
「投資対効果」「実現可能性」に負けないための”対話”
すぐ上で述べた「データ活用に無関心である」課題として、本書でも述べられているように「投資対効果が低い」「実現可能性が低い」という2点は間違いなく存在している。
この2つにはそれを言うだけの材料が各社にあるのだと思う。「それを準備できる環境・予算がない」だとか、「活用できる人材がいない」だとか…。もちろんそれらはすぐに解決できる問題ではないだろうし、本当に悔しい気持ちで伝えている企業もあると思うが、
もしかすると 「よくわからんけど、なんだか難しそうでは?」 というなんとなくの先入観・嫌悪感が先行している現状もあるのではないだろうか。
投資対効果・実現可能性といった課題は間違いなくあると思うが、まずは本当にそれが課題なのかを擦り合わせるコミュニケーションが重要になってくるように感じている。
果たして日本は"データ活用先進国"になれるのか
本書では、データ活用先進国になるために、まずは「各社でデータ分析のための環境を用意する必要がある」と述べている。
私も現職で今あるデータを活用したいと考えいろいろと試行錯誤したが、結局はここがいちばんの障壁になった。仮にデータを機械学習モデルにかけようとすると、大量の前処理(と呼ぶには程遠い地道な作業)が必要で、それを行うための環境がなかったのだ。Excelに落とすことや%表示を実数に直すこと、データの場所がバラバラかつ1個人には権限がないことや必ず入れたい要素が一覧で手に入らないため手入力でコピペする必要があること(これが一番しんどかった)、環境の面でいろいろと難しいことを痛感した。
きっと私の会社のようなデータ基盤の企業、私のような思いをした個人も一定いるのではないだろうか。企業の規模や馬力はあるはずなのだが、必要な基盤を持っていないし、持とうとしていない。これはデータ活用だけでなく、ITの領域全般がまだそのような状況かもしれない。経営陣に説得する・交渉するという姿勢はもちろん必要だと思うが、それを簡単に行えるのが「開発サービス」だと思う。
データサイエンスの領域はまだまだ理解が得にくいというハンデを持っているが、ここをいかに伝えられるかというツールは年々進化しているように感じる。1番の近道はデータドリブンやDXをサポートする企業がどんどん進化し日本の企業群を引っ張っていくような構図で、そうすることで日本は”データ活用先進国”になれるのではないだろうか。