データサイエンティストってなんだ?
僕は現在とあるコーヒーチェーン企業でデータサイエンティストとして働いている。
なんやかんやで社会に出てから約5年ほどが経った。
ただ、正直なところ僕自身が最近まで
データサイエンティストがどのような職業なのかよくわかっていなかった。
「働いてるのに何を言っているんだ?」と思われるかもしれないが、落ち着いて聞いてほしい。
おそらくその理由はデータサイエンティストという職業に対するイメージが人によってバラバラであり、自分のやっていることが世間一般で言うところの「データサイエンティスト」なのかよくわかっていなかったからだと思う。
そんな中、最近『データ分析失敗事例集』という本で「データサイエンティストには4つの分類がある」という話を読んでしっくりきたので自分の経験も合わせてまとめたい。
4つの分類
まずは書籍に載っていた4つのパターンをざっくりまとめてみよう。
1.研究者型
環境: 会社の研究開発部門など
- 最新の論文を読んで、そこから得た技術を社会実装するのが目的
- 統計学や機械学習に関する幅広い知識が必要
- ソースコードをベースに自らのアイディアを実装するため、プログラミングスキルが必須
- 一方で自分のコードを他人が保守・運用するという意識が薄い
- 保守担当のエンジニアを悩ませることがある
- ビジネスよりも技術へのこだわりが強い
- 実務上何の役に立つのかわからず突っ走ってしまうことがある
2.エンジニア型
環境: Web系企業など
- 機械学習アルゴリズムをシステムに組み込んで課題解決する
- アルゴリズムの知識だけでなく、どうやってパイプラインに流し込むかも考える
- 必要な計算資源の見積もりやどうやってシステムを実装するか、など
- 保守性やソースコードの書き方にこだわりがある傾向
- 自身の成果物がどのようにユーザーに届けられるかに興味がある
- 一方で政治的な高度な駆け引きは苦手
3.アナリスト型
環境: コンサルファーム、事業会社のマーケティング部門など
- データ分析を通じてビジネスの意思決定を支援する
- 分析の方法論よりどのような示唆が得られるかの方が重要
- 統計解析やBIツールを使いこなしてマーケティングやビジネス課題にも精通
- パワポを用いたプレゼン能力も必要
- 一方でプログラミングやシステム設計はあまり得意ではない傾向
4.エリートビジネスマン型
環境: IT業界以外の大企業など
- 「AIで何とかしてよ!」の無茶振りに対応する魔法使いのような存在
- 企業自体データを深く理解していないことも多く、あらゆる期待を寄せられる
- 戦略立案、業務改善などビジネス寄りのものからアプリケーション開発のようなものまで
- 黎明期のデータサイエンティストにはこのような超人がいたかもしれない
- だが、一般的にこのような人材は極めて少ない
僕のデータサイエンティスト像の変化
ここでは僕の今までの経験を中心に述べるので、「そんなの興味ないぜ!」と言う人はさっさと飛ばしてほしい。
僕がこの分類に感銘を受けた理由として、自分が上記の「1~3までのデータサイエンティスト像」すべてに触れたことがあり、その度ギャップに苦しんできたからだ。
大学院時代
僕が最初に触れたのは1.研究者型
の像だった。
自分は大学院時代に物理学を専攻しており、研究内容は今で言うビッグデータ分析のようなものだった。
当時は「データサイエンティスト」をようやく知ったくらいの時期であり、正直どのような職種なのかわかっていなかった。
ただ、自分のやっている内容が「論文を読んで、それをベースにプログラミングでアイディアを実装する」という類のものだったので、何となくその延長線のようなものをイメージしていた。
まさにこれは研究者型のデータサイエンティスト像である。
当時を思い返せば確かに論文を読んだり数式をプログラミングで実装することは多かったが、自分の書いたコードを誰かが保守・運用することは考えたことなかった。
自分の考えた最強の「オレオレコード」を量産していた気がする。
「これからはデータサイエンティストの時代だ!」と思った僕は博士号取得後にアカデミアには進まずにWeb系企業に就職するのだった。
Web系企業時代
某Web系企業に就職した僕の仕事は「既存の機械学習システムの保守、運用をしながらも改善して精度を上げていく」とうい類のものだった。
どちらかといえばデータサイエンティストというより機械学習エンジニアに近いものであり、上記の定義だと2.エンジニア型
に近いものだったと思う。
まず最初に感じたは「僕は綺麗なコードが書けない!」ということだった。
可読性や保守性のことなんて考えたことがなかったので優秀なチームのエンジニアだったりリーダブルコードのような書籍だったりを読みながら必死だった気がする。
特にシステムに関しては苦手意識があり、機械学習モデルの改善は楽しかったもののどうやってシステムを構築、改善するかについては苦労した。
今思い変えればこれは1.研究者型
と2.エンジニア型
のギャップに苦しんでいたのだなと思う。
あるとき会社の技術ブログを書かせてもらうことになった。
その際自分の職種が「データサイエンティスト」なのか「機械学習エンジニア」なのかわからず、なんとなく名前がカタカナでかっこいいからという理由でデータサイエンティストと表記したのを覚えている。
それくらい職種に対する解像度が甘かったなーと今思い返せば感じる。
現職(小売企業のデータ分析部門)
最初に働いた企業を4年ほどで転職し、現在は某コーヒーチェーン企業でデータサイエンティストとして働いている。
Web系企業と違って全社員のうちITの素養があるのは少数であるため、他部署からの分析依頼された結果を技術に明るくない人にもわかりやすいように伝える能力が重視される。
これはまさに3.データアナリスト型
だ。
前職に比べてよりビジネスの意思決定に関われるチャンスが増えたためやりがいはある。
一方で複雑なアルゴリズムを実装する機会が減ったため、プライベートな時間でコード書いたりしてエンジニアとしての感覚を忘れないようにする必要があるとも感じる。
このようにまとめてみると、僕が今まで同じ「データサイエンティスト」だと思っていた職種は微妙に違う型だったことがわかる。もし事前にこれらを知っていればもっと新しい環境に順応しやすかったのかなーと思った。
データサイエンティストを目指すなら「どの型になりたいか」を考えよ
今まで見てきたように、「データサイエンティスト」にはいくつかの型があり、企業によって微妙に定義も異なるものである。
もしこの記事を読んでいる人でデータサイエンティストに興味のある人がいる場合は、自分がどの型に向いているのか考えた方がいいだろう。
これらを踏まえれば同じデータサイエンティストの募集があったとしても
- コンサルティングファーム or Web系事業会社 or ベンチャー
などで全く別のスキルが要求されることに気づくだろう。
このようにして会社や業界でなんとなく業務内容は予想できる。
より詳細に知りたければJob Description (求人情報)をじっくり見ることをおすすめする。
例えば業務で必要な技術に
- 統計ツール、BIツールを使いこなし、ステークホルダーにプレゼンする能力
など書いてあれば3.アナリスト型
の傾向が強いことがわかるし
- 査読付き論文の執筆経験、学会発表経験
などが強調されていれば1.研究者型
の要素が強そうだ。
最後に
「データサイエンティスト」という言葉は「AI」と同じくらい意味が曖昧で人によってイメージが違ったりする。
もしデータサイエンティストとしてのキャリアを目指すのであれば自分がどのような役割を果たすのかを事前に把握した上でキャリアを形成することをおすすめする。
自分は運良く1~3のすべてのパターンでそこそこ楽しくやることができたが、おそらくパターン4は向いてないのではないかなーと思ったりした。
参考文献