「Data Scientistは何故希少種なのか?」
どうも。Yuuseiと申します。
家の近所でアナリストとしてB2B周りの分析をしてるんですが、
本格的にデータサイエンティストと名乗るために自分の中で整理をつけようと思い、
重い腰を上げた次第です。
※この投稿はシリーズものの一部です。
part1 <-[part0](http://qiita.com/yuusei/items/49a63f4402afc66243e6)->part3
さて、
世の中ではData Scientistが足りてないという話はだいぶ前から出ていますが、
その大きな理由は「必要なスキル全てを兼ね備えるのは難しいから」と言われています。
それは確かにそうなんですが、僕は別の理由があるだろうなと思っています。
「都度数学的に裏付けのある方法を検討していたら、今のビジネスのスピードについていけない」
こう言う事なんだと思います。
つまり、Data Scientistは誰もが憧れる「理想」を見ている職業であり、
現場ではそんな理想なんかよりも「早く」「多くの」売り上げを上げる事が優先され、
その結果、
・ビジネス力のある人はサイエンスに必要な手順の細かさに我慢できずスキルアップできない
・サイエンス力のある人はビジネスのざっくりさが我慢できない。そもそも「利益を上げる」と言う事が我慢できない
このような理想と現実の乖離を埋める事ができず、
また、仕事の内容がこれらの乖離を埋める様な設計になっておらず、
Data Scientistはビジネス環境で育ちにくくなっているのだと思います。
これを踏まえると、最近は機械学習の実装エンジニアなどの仕事が出回っているのはわかる気がします。
誤解を恐れずに言うと、機械学習は「詳しいマナーを知らなくても誰でもそれなりの結果が出せる」様に設計された
数学的なツールであり、理解できてなくても性能が出せるだけに、ビジネスと相性がよく、
サイエンス力がなくても、数式がコードで書ければとりあえず実務には十分なのです。
その為、コードを書いて実装してきた人たちが即戦力として呼び込めるので、
幅広い知見を必要とするData Scientistよりもお手軽な職業なのでしょう。
個人的には数式を理解せずに手法を使うのは好ましくないと思っています。
不適切な手法を現実の問題に適用してしまうからです。
ですが、機械学習はデータといくつかの手法があれば
とりあえずその中から精度の高い予測をシステマチックに選べ、
ビジネスのざっくり感とスピード感を求めるニーズにマッチしてるので、
引き合いが増えてきてるのだろうと勝手に思っています。
なので、機械学習の実装エンジニアはData Scientistとは全く別物であり、
みんなが「必要だ」と考えるData Scientistは理想の中の存在として、
理想ニーズは高くても現実ニーズは低いまま、希少種であり続けるのだと思います。
Data Scientistはなるのが難しく、
機械学習実装エンジニアより働き口は少ないでしょうが、
応用系の数学や物理学を追求していきたい自分みたいな人間には適してるんだと思います。
最後に、完全に横道に逸れるんですが、
たまに覗くData Science Central と言うウェブサイトに 良い/悪いデータサイエンティストを面接で見つける方法-How To Identify A Good/Bad Data Scientist In A Job Interview?と言うのがあったので、紹介しておきます。
ではこの辺で。par3はもう草稿ができてるので、そんなに時間かからないと思います。
できた->part3