##まえがき
###はじめに
こんにちは タスクンと申します。
社会人を2019年4月 から SES(System Engineering Service) として働き始めました。
それから1年と6ヶ月を経て
2020年10月にデータサイエンティストとして内定を頂きました。
一旦、区切りがついたので 転職までの過程を 備忘録 も兼ねてまとめておこうかと思います。
あくまで1例であり、再現性があるかどうか微妙なので 参考程度に留めてもらえると嬉しいです。
データサイエンス業界は駆け出しなので、あくまで経験談として書いていきます。
###対象読者
・未経験からデータサイエンティストへの転職を考えている方
・データサイエンティストへ転職したいが何から始めればいいのか分からない方
###自分のスペック
・数学は 数Ⅲ 数C まで
・大学院建築専攻修了
・大学の偏差値は50前後
###保有資格
・統計検定2級
・Javaシルバー
###実務経験
・SQL、BIツール
##新卒からデータサイエンティストになるまで
・2019/04 社会人スタート
・2019/10 データ抽出や整備を行う業務に参画 (SQLやBIツール)
・2020/01 統計検定2級取得
・2020/01~03 データラーニングスクール受講
・2020/04~06 Kaggleチーム開発(難易度が高く途中で離脱)
・2020/08 Udemy のPython講座受講
・2020/10 データサイエンティストとして内定
##目次
#####・ 入社からSQLの現場参画まで (2019/04~2019/09)
#####・ 現場に入ってから統計検定2級を取得するまで (2019/10~2020/01)
#####・ [データラーニングスクール 受講から転職活動開始まで (2020/01~2020/08)](#データラーニングスクール 受講から転職活動開始まで (2020/01~2020/08))
#####・ [転職活動開始 から 内定を頂くまで(2020/08~2020/11)](#転職活動開始 から 内定を頂くまで(2020/08~2020/11))
#####・ 未経験からデータサイエンティストになる上で大切な要素
#####・ おわりに
##入社からSQLの現場参画まで (2019/04~2019/09)
2019/05
データサイエンティストという職種を知ったのは
IT業界にはどのような職種があるのか調査をしている時でした。
データサイエンティストになりたいと思うキッカケは安直なもので
仕事内容が面白そうで、他の言語と比較して平均年収が高かったからです。
(今思うと、言語ごとの平均って当てにならないです。。)
2019/07頃から面談がスタートして
データサイエンティストといえば Python でしょって感じで社内にある案件を漁っていました。
ところが、Python の未経験募集が全くない・・ というか 0件 笑
未経験者の案件ないのに どうやって経験者になるの?? って感じでした。
当時、私は 人生逃げ切りサロン に入っていて
偶然にもオフ会にデータサイエンティストの方が来られるとを聞き
業界の事情を知るために会いに行きました。
話をする中で SQLから経験を積む事から勧められ、SQLの未経験可の案件を探す事を始めました。
データの扱い方 や 分析するデータ を自分で出せるようになっておいた方が良いとの事でした。
それと同時に "Progate" や "Aidemy" でSQLの勉強と
MENTA を使用して Python の勉強を始めました。
その後、未経験SQL現場も案件数は少なかったですが、面談まで進む事が出来ました。
データサイエンティストの方からヒアリングをした事を入り混ぜながら
・何故、データサイエンティストになりたいのか
・それに対して今やっていること
などを話し参画に至りました。
##現場に入ってから統計検定2級を取得するまで (2019/10~2020/01)
現場に入ってからは、エクセル またはSQLを使用してデータ抽出を行っていました。
とはいっても事前に簡単な構文しか学んでいなかったため、複雑なSQLコードは書けません。
また、SQLを知っている人が同じ部署にいなかったため質問もし難い環境でした。
幸いにも、SQLは間違った構文も書いてもエラー発生をし難く
出てくるデータから差分を考えてコードの仕組みを理解していく事が出来ました。
SQLのロジックを考えるのは結構面白く あまり苦なくSQLを身につけていく事が出来ました。
最終的には BIツールのTableau と SQL を連携させてデイリーやマンスリーでの自動更新なども行っていました。
一度作ったらほっといても動くので自分が何人もいて、作業している感覚になりとても嬉しかったのを覚えています。
TableauとSQLの連携まで出来る人が少なく重宝されるスキルだったかと思います。
2019/12になると
データサイエンティストになるためには統計の知識が問われると知り
統計検定2級の取得を目指しました。
勉強方法としては標準的なもので過去問を繰り返しました。
統計WEBの過去問の解説はかなり丁寧に書かれており
理解出来なかった場合はそちらで補っていました。
初めて過去問をやった時は、ランダムに選ぶよりも低い点数を取ったので諦めかけましたが
それ以降も勉強を継続し 2020/01 に統計検定2級を取得しました。
統計検定を取得して良かったのはエクセルの関数を理解出来るようになったことや
初めこそ知識が孤立していましたが、データをみていく中でデータの分散や偏り、平均値だけで判断するのは危険な事だと気づけたことです。
##データラーニングスクール受講から転職活動開始まで (2020/01~2020/08)
2020/01 になるとデータラーニングスクールに通い始めました。
簡潔に言いますとこの講座ではデータサイエンスを体系的に学ぶ事が出来ました。
データサイエンティストという仕事は私の想像していた以上に広く学ぶ事が多く
それまでは統計の知識とPythonが出来れば良いと考えていましたが
むしろその他の重要な知識の基盤がないと
統計の知識もpythonも全く使い物にならない事が分かりました。
以下の記事ががデータサイエンティストに必要な勉強項目のインデックスとして参考になるかと思います。
データサイエンス入門のための学習書籍・コンテンツ(2020年4月版)
また、講座を受けている中で現場で使える内容が多かったので現場に即したカリキュラム内容なのかなと感じました。
特に SQLでの分析実習 や 発表方法のフレームワークなどの知識が現場で応用を効かせる事が出来ました。
2020/03 に講座を終えた後に
2020/04 からkaggleのチーム開発を始めました。
kaggleは初めてで右も左も分からない状態でした。
チーム内でkaggleのnotebookの読み合いなども頻繁に行っていましたが
pythonのアルゴリズムおろかコードすら読めずについていく事が出来ませんでした。
結局、1ヶ月経過後も周りの参加者についていけずに
後ろめたい気持ちを抱えながらもチームから離脱しました。
2020/05 になると kaggleで上手くいかなかった事もあり
自分はもしかしたらデータサイエンティストになれないかも知れないと思い始めました。
勉強にも身が入らずダラけていました。
でもチラッとtwitterを見ると
同時期に勉強を始めた人が成果を出すのが見えるんです。
「お前このままで本当にええんか」 と言われている気がしました。
2020/07
この時期はある程度エネルギーも充電され
直近で何も努力していないこともあり何か始めないと人間として何か終わると思い始めました。
とりあえず、Kaggleの時に理解できなかったPythonの基礎構文から始めました。
教材としては Udemyの [米国データサイエンティストがやさしく教えるデータサイエンスのためのPython講座] (https://www.udemy.com/course/ds_for_python/)です。
この講座が自分のレベルに合っていたのか、容易に内容を理解する事が出来ました。
その後、現場でもpythonを使わせてくれと上長にお願いし
可視化の目的で使わさせてもらうことになりました。
データ量が多く複雑でもpythonのコード数行書けば一瞬で
綺麗で見やすいグラフが作成出来るため
魔法を使っている気分でした。
##転職活動開始 から 内定を頂くまで
2020年8月頃に現場経験が1年に近くなったので転職先を探し始めました。
方法として データラーニングギルド と Linkdinの転職エージェントを使用しました。
データラーニングギルド大手の未経験可の案件 を10件ほどを紹介して頂き、書類を送りました。
結果、全ての選考で面接まで至らずに書類選考で落とされました。
急ぎの転職ではなかったので焦りはありませんでしたが
未経験可の案件でも書類選考を通過しなかったので予想していたより
選考基準が高いのかなと感じていました。
同時期に私は偶然Twitterのタイムラインに流れてきた
データサイエンティスト の募集に申し込みました。
こちらでは書類と1次面接を通過し、採用課題に取り組みました。
採用課題の内容としては
「1週間程度で 顧客の抱えている問題をデータも用いて解決し、発表資料作成せよ」 というものでした。
手法については、特に指定されず自由度の高い課題内容だったかと思います。
手順としては
・ データの可視化
・ 手法についての調査
・ アルゴリズムの作成
・ 発表資料の作成
上記の流れで取り組みました。
私自身こういった課題は初めてだったのですが、1週間フルコミットでどうにかなりました。
その後、課題に合格することでき、最終面接を経て内定を頂きました。
内定後に足りないスキルを補うため
何か勉強した方が良いことはありますか? と聞いたところ
統計検定 と 基本情報 または 応用情報 の勉強を推奨されました。
この辺の資格は面接時でも評価される可能性があるかと思うので
データサイエンティスト転職を目指されている方はこの辺の資格習得を目指してもいいのかと思います。
kaggleについては
メダルは取るだけならチーム開発や代理を立てて取れるため参考程度とのことです。
kaggleの代わりに 採用課題 でどの程度の能力があるのか判断するようです。
##未経験からデータサイエンティストになる上で大切な要素
個人的な見解ですが、下記になります。
・その道のプロに話を聞きにいく
・未経験ならSQLを学べる現場から
・モチベーション維持のため「何故データサイエンティストになりたいのか」 を固めておく
##おわりに
私もこんな早くにデータサイエンティストになれるとは想像もしていませんでした。
データサイエンティストになりたいと言い続け
周りの方に恵まれたのが大きかったのだと思います。
データサイエンティストは
その人の経験や性格面なども考慮せねばならず万人に向いているとは考えていません。
しかし、個人に見合った 正しい方向性の努力 を 長期的 に続ければ 結果は必ず付いてきます。
まだまだ、社会人としても駆け出しですが、私の経験が誰かの一助になれば幸いです。
今回の記事は概要になります。
掘り下げて欲しいところありましたらリクエストもらえると嬉しいです。