この記事はデータラーニングギルドアドベントカレンダー15日目の記事です。
今回がQiitaで初投稿となります。(文字数多めです)
よろしくお願いします。
#自己紹介
私は理系の物理系の院卒で、関西の大手メーカーに新卒で就職しました。
在職時にはR&D部門の研究者として新しい技術の開発や研究活動に従事していました。
現在は、都内の某受託分析の会社でデータサイエンティストとして勤務しています。
年齢は30代前半で既婚(子供1名)です。
この記事では何故、製造業のR&D職から受託分析のデータサイエンティストへジョブチェンジしたのか、
そして、ジョブチェンジにより、何がどう変わったのかをお伝えできればと思います。
#想定している読者:
・今、製造業などの事業会社にいて、データサイエンティストあるいは機械学習エンジニア
にジョブチェンジしたいが一歩踏み出せずにいる人
・単純に転職しようか迷っているが、転職の前後で何がどう変わるのかイメージを掴めずにいる人
#前職:製造業のR&D職について
冒頭にも述べた通り、私は新卒でメーカーのR&D職として働いていました。
R&Dがどんな仕事なのか掴めない方もいらっしゃると思いますので、簡単に説明します。
R&Dでは既存の技術を単純に改善するというよりは0から1を生み出し、会社の新しい飯のタネとなる技術の開発を行います。通常の技術開発と何が違うか、エアコンの開発を例に考えてみます。
・通常の技術開発
通常の技術開発では、既存のエアコンの省エネ性能を1%改善するために、エアコンの要素Aを少し改良して達成します。したがって、構成が大きく変わるというよりは現在の製品をベースに考えます。技術開発の期間は通常1年未満です。もちろん、この技術開発があって、製品が出るからこそ、会社は利益を出し、そのお金がR&Dに回ってくるわけですから、非常に重要な役割です。
・R&Dにおける研究/技術開発
R&Dの場合は原理から異なることが多いです。例えば、新しい原理の冷却システムを開発しました。この為、エアコンの大きさがこれまでの60%で済みます。あるいは、これまで全く測れていなかった空気の成分xを測れるセンサーを開発しました。これを搭載したエアコンでは部屋にどれだけ埃があるか分かりますなど。
これらの新原理エアコンを市場に投入すれば、ゲームチェンジが起きる可能性がありますよね。
(その分、失敗するリスクが大きく、ハイリスクハイリターン)
こういった仕事にチャレンジするのが企業のR&Dです。技術開発の期間はプロジェクトに依存しますが、数年 ~ 5年など足の長いプロジェクトが多いです。(上手く行けば、事業部に技術移管し次のフェーズへ)
企業の研究者は日々、論文を読み、実験やシミュレーションに勤しみ、ディスカッションを行い、新しい技術の開発を行います。また、企業ブランドイメージの確立、その分野におけるプレゼンス向上の為、
・国内外の特許出願
・口頭での学会発表
・査読付きジャーナルへの投稿
・プレスリリースの発表
など対外的なアウトプットも多いです。新しい事を学ぶのが好きな方にとっては非常におススメできる仕事だと思います。
在職時には、
・新しい原理の水処理デバイスの開発
・センサーの開発支援のための数値シミュレーション
・新しい原理の数値流体力学のプログラム開発(フルスクラッチから)
などをやっていました。
特に直近はシミュレーションやCUDAを用いた数値計算コードの開発などをメインでやっていました。
#なぜR&D職から転職しようと思ったのか
前職のR&D職は非常に面白く、会社に対してそこまで大きな不満もありませんでした。
ホワイト企業でしたし、給与も悪くなかったと思います。
(余談ですが、メーカーは休みが多いです。年末年始、GW、シルバーウイーク、そして、お盆休みなどは2週間近くあり、一種の夏休みですよね。また、5年目、10年目など節目節目でも2週間ほどの特別休暇があり、ワークライフバランスを重視される方には良い業界といえます。)
さて、本題に戻ります。ではなぜR&Dから離れようと思ったのか?
理由は主に製造業のR&Dというポジションに由来します。
・足が長くハイリスクハイリターンなので、事業化までの時間が非常にかかり、かつ多くのプロジェクトは失敗する。
・基礎研究なので、実際のビジネスとの距離が遠い
・製造業はモノづくりが強い人たちの集団なので、IT系のキャリアを積むには適していない
まず1つめの観点ですが、基礎研究自体はやっていて非常に面白いのですが、実際に事業化するまでの道のりが途方もなく長いです。原理検証→試作機・デモ機の作成→事業部とのロードマップを握りながら、量産化に向けた課題抽出→工場における量産ラインの立ち上げ...などプロジェクトが始まってから短くても7年くらいはかかるのではないでしょうか。
仮に1プロジェクト事業化まで含めて7年として、3プロジェクトで20年かかります。3プロジェクトのうち1プロジェクトでも成功すればいいですが、3プロジェクト共、失敗した場合、世の中に貢献できぬまま、キャリアを終える等という事になりかねません。肌感ですが、その確率は決して少なくないのではないかと思います。
また2つ目の観点として、R&Dはどうしても世界初、最先端、世界最高レベルのものに価値を見出します。
これは論文を出したり、学会発表したりする上ではとてもよいのですが、実際のビジネスで量産化をする観点では、マイナスに働きます。
例えば、試作機までできたとして、事業部に事業化の話を持ち掛けたとすると、コスト面で事業部から割に合わないと言われることが多いでしょう。また世界最高レベルのものって得てして作りにくいのです。この為、量産化には向いていないことも多いです。この場合、事業部側に立つと、全く作ったことがないから、工場での量産ライン立ち上げなど多額の設備投資が必要です。加えて品質保証どうやってやるんだとか課題は山積みかと思います。
すると事業部からは当然ですが、これに投資する事で、どれくらいのビジネスインパクトがあり、何年で投資を回収できるのかと質問されます。もちろん市場規模や狙えるポジションから試算はします。ただ、研究所の人間はテクノロジーに関しては強いですが、やはりその辺は事業部の方が得意領域ですから、それと比べると見積もりが甘かったりする。つまり、R&D部門は技術と実際のビジネスとの距離が遠いと言わざるを得ません。
またこれは私自身の趣味嗜好的な話ですが、世界初の技術をビジネスに展開するようなプロダクトアウト的な考え方よりも、まず課題から出発し、その課題を解決できるテクノロジーを開発するマーケットインの方が馴染みました。この点でも研究所よりもビジネスにもう少し近い領域で仕事をする方が、自分に合っています。
この為、私はテクノロジーをやりつつ、それが世の中のビジネスに直結しやすい領域で勝負した方がよいと考えました。そして、色々検討した結果、その職業はがデータサイエンティストであると結論しました。
ご存じの通り、データサイエンティストは企業のデータ利活用によるビジネスの変革を成し遂げる為の何でも屋的なポジションです。
この図はよく引用されるデータサイエンティストに求められるスキルセットですが、まさにビジネスとテクノロジーが融合した領域こそがデータサイエンティストの主戦場です。
企業のDXは非常に多くの要素が絡み合っているため、実現のハードルは高いです。ただ、できた暁にはそれが企業のビジネス変革に直結しますから、R&Dで課題だったビジネスとの距離が遠いという問題もありません。寧ろ、DXはビジネスとは密接に絡み合っているので、ポジションは全く逆と言えます。
では、部署異動で単にデータサイエンティストになればいいのではないか?と思われるかもしれません。
選択肢としては全然有りだと思います。この辺は一長一短ですので、人によって判断が分かれるところです。
事業会社のデータサイエンティスト
Pros:
・やった仕事が自社の利益に直結する
・自社でデータを持っているし、無ければインフラ投資もできる
・これまでの業務知識をそのまま活かせる(これは強いメリット)
Cons
・データサイエンスに詳しい人が多いわけではない為、ロールモデルとなる人がいない可能性が高い
・データサイエンスより自社のビジネス、製品に詳しい人の方が多いので、やっている仕事が難しかったとしても成果の意義をや難易度を正しく理解してもらえない可能性がある
・DXにはデータ活用の基盤作り(データマートの構築など)、データ分析、機械学習・統計モデルの作成、作成したモデルのシステム実装、そして最後は構築したシステムを活用する風土醸成・人材育成など非常にやることが多いが、データサイエンティストの絶対数が不足している為、組織体制としてDXをやりきる体制になっていない可能性がある。
などでしょうか。
製造業の多くは100年以上続く企業も多く、創業当時からずっとモノづくりをやってきました。この為、モノを作ることに関するノウハウや人材の厚みは相当深いです。一方で、データサイエンスが出てきたのはざっくり2010年くらいからだとすると、比較的最近です。この為、マネージャークラスの方が新卒だったころはそんなもん無かったわけです。という事は、必然的に人材も不足しますし、プロパーのマネージャー層がデータマート、クラウド環境、機械学習、SOTAなディープラーニングのモデルに明るい可能性はそんなに高くないと思います。この場合、プロジェクトが順調なうちは良いのですが、詰まったときに困ることになります。課長に相談したいけど、課長も周りも詳しくない→誰に相談したらいいんだろう、となります。
逆に受託分析でデータサイエンティストをやった場合のメリット・デメリットは次の通りです。
受託分析のデータサイエンティスト
Pros
・会社の事業としてデータサイエンティストや機械学習エンジニアを抱えているので分析人材が豊富。この為、ロールモデルとなる人がいる可能性が高い。(データサイエンティストとしての成長環境が良い)
・経験豊富なエンジニア・データサイエンティストを抱えている為、企業のDXを推進するために必要なプロジェクト体制を確保できる
・業界を跨いで様々な企業のデータを取り扱える為、飽きない
Cons
・お客さんはもちろんドメイン知識に詳しく、専門的な話をしてくる。一方で自身がその業界について知らない場合、この専門的な話に付いていくためのキャッチアップが必要。短期間で多くの事をインプットする必要がある
・自社でデータを持っていないので、データを受領するまで、どれくらいデータが汚いのかなどが事前に把握できない場合がある。この場合、いざ受託してプロジェクトを開始したら、データがノイズだらけでした、あるいは必要なデータがありませんでした、となるリスクがある。(garbage in, garbage outなので、この場合、大変ですね。)
・分析専門の会社なので相手からするとこちらに対する期待値が高い(先方からすると、わざわざお金払っているわけですからね。)
まあどちらも一長一短という感じですよね。
#受託分析のデータサイエンティストに転職しました
上で書いたようなメリット・デメリットを鑑みて、私は後者を選択しました。
理由はデータサイエンティストとしてのキャリアを歩んでいくうえでの適切なロールモデルの存在です。
私は製造業のR&D職で述べた通り、新しい原理の数値流体力学のプログラム開発(フルスクラッチから)を数年やっていたのですが、部署には数値計算のコードを書ける人がほぼいなく(シミュレーションソフトを使える人はもちろん多数居ます)、社内全体で見てもかなり小数でした。特に数値計算をCUDAで書いている人は極めて少ないのではないかなと思います。
この場合、開発方針・スケジュールも自分で決め、コード開発も自分でやり、上への成果報告もほぼ自分でやるというような感じで、何が正解かも分からない状況をほぼ一人で歩み続けるという苦しい状況が続きます。そして、上司もシミュレーション分野ではなく、実験寄りの人だった為、数値流体力学のコードのアルゴリズムの相談ができるわけもなく、相談先は知り合いの大学の先生(しかも、共同研究ではなく好意で相談に乗ってもらう)という状況でした。中長期的に見ると、このキャリアの積み方は良くないなと感じていました。
数値計算でこんな状況でしたから、他部署に異動してデータサイエンティストとして働いたとしても、似たような状況が続くんじゃないかな、そう推論したのです。(もちろん間違っていた可能性もありますが。)
これから、データサイエンティストとしてしっかりとしたキャリアを歩む上なら、ここではなく環境を変える必要がある、そう感じました。
ただ、多数のデータサイエンティストが在籍している分析の会社の多くは東京にある為、住み慣れた関西を出る必要がありました。
これは個人的な事情なのですが、ちょうど子供が来年から幼稚園に行く予定で、通う幼稚園も既に決まっていたので、妻には反対されました。この辺は家庭を持つと大変なので、転職するなら独身のうちにすることをお勧めします。私は比較的長い期間を掛けて説得し、都内の受託分析会社へジョブチェンジしたのです。
#転職してどうだったか
結論から言うと、**良かったですね。**もし同じような状況で悩んでいる人が居たら背中を押してあげたいです。
想定通り、データサイエンティストが多数在籍しており、これまでのDXのプロジェクトの知見が溜まっており、なおかつ、この人は凄いなというロールモデルと言える人も在籍していました。
またこれは想定外だったのですが、中途で入社したにも関わらず、データサイエンティストとして活躍するための研修も充実していました。成長のために環境を変えるというのは正しい選択肢だと実感しました。
現在、データサイエンティストとして早速、プロジェクトにアサインされましたが、受託分析は面白いですね。
担当業務としては、BigQuery上へのデータマートの構築、Pythonでのデータ分析などをやっています。
なお、余談ですが私は転職を開始する前から、データラーニングギルドの村上さんが運営されているデータラーニングギルドのスクールを受講していましたが、これはおススメです。(何かを貰って紹介しているわけではありませんのでご安心を 笑)
データサイエンティストとして活躍するには、結構幅広いスキルが求められます。
例えば、エクセルを使ってちゃちゃっと分析をする場合もありますし、GCPのBigQuery上でSQLを叩いたり、SQLで前処理をしたデータをPythonで分析するという事が実際にあります。(今、まさにやっています。)
データラーニングギルドのスクールはデータサイエンティストとしての村上さんのキャリアをベースにカリキュラムが組まれていて、先のエクセルを使ったデータ分析やSQLを使った分析などデータサイエンティストとして必要なことが一通り網羅されています。
個人的に役に立ったのはBigQueryを使ったSQLの分析ですね。今、BigQueryを使ってSQLを叩いたり、その結果をデータポータルで眺める機会が多いので、習ったことがそのまま使えたと思います。
ちなみにですがこのスクールはデータサイエンティストを養成する為のカリキュラムになっています。
データサイエンティストと機械学習エンジニアは求められるスキルセットが異なります。
機械学習エンジニアは名前の通り、より機械学習とエンジニアとしてのスキルに特化することになるので、データサイエンティストとも仕事内容が結構異なります。もし転職される場合はこの辺りの違いはよく意識された方が良いかと思います。
両者の違いはTJO尾崎さんのブログで解説されており、非常に現場間のある定義になっています。
#最後に
私は今回、製造業のR&Dから受託分析のデータサイエンティストに転職しましたが、製造業のR&D自体も0から1を生み出す非常に面白い仕事です。やはり、自分の開発したデバイスが製品に搭載され、世の中に出ていく可能性があるという点も魅力的な仕事だと考えています。また働く環境も働きやすかったですし、一緒に働いていた方々もいい人ばかりでした。
そして、今のデータサイエンティスト職も日本の企業がDXを果たす上で重要な仕事だと考えています。
この記事が製造業に行く人にとっても、データサイエンティストになろうと思っている人にも役に立てば幸いです。