この記事は
「5年後にデータサイエンスを扱う職に就く」を目標に、独学で進めている人間の記事です。
期間設定や目指す理由は割愛しますが、
- 0からどう学んでいったかの足跡を残したい
- 定期的に書き出して現状を振り返りたい
そんな思いで書いています。
いつかこの記事が、似た境遇の誰かの参考になれば嬉しいです。
現状
私の現状についてです。
- SEだが普段業務でプログラムやSQLなどは書いていない
- 趣味として競技プログラミングを始めた(良ければ下記記事をご参照ください)
https://qiita.com/t_j_/items/6e76cab47dfb1fc5fb97 - 基本情報技術者を昨年取得したくらいの知識レベル
目指すレベル
「データサイエンティスト」で求人を出している企業が求めるレベルを、ひとまずゴールに設定しています。
- 統計検定準1級
- コンペの経験(Kaggleなど)
- 機械学習モデルの開発経験
これらの目標に対する現在の所感は以下の通りです。
- 統計検定は分かりやすい目標だと捉えている
- 逆にコンペ経験はどの程度を目安にするか悩み中。受賞を目指して本腰を入れなければならないのか?少なくとも複数回参加して、改善の模様をレポートに残してポートフォリオに加えたい
- 機械学習モデルの開発経験も今はまだゴールが見えないので、知識をつけながら具体的な目標を決めてく
今具体的に何をしているか
ゴールに向けて、しばらくは「統計」と「機械学習」の2分野で学習を進めます。
統計分野
下記Webサイトで学習を始めました。step0の基礎編を終えたところです。
https://bellcurve.jp/statistics/course/?srsltid=AfmBOoq7c4sPx-VZuFHtLk4dAStAW_a9BfW8mAZK_fDKrBbsimpdScy3
丁寧に説明されていて、統計検定2級の範囲までカバーされてるとのことです。
機械学習分野
まだ何も手を付けられていません。これからです。
これからのロードマップ
ゴールに向けて何を行なっていく想定か、その中でも次は何をやるかを明確にします。
分野は先の今具体的に何をしているかに則って二つに分けました。
分野ごとに「座学形式」と「実践形式」で分けて、具体的に進める内容を整理します。
どちらを先にやるかは決めず、必要に応じて進めていくつもりです。
統計分野
- 座学
-
実践
- Pythonブートキャンプ[データ分析コース]
https://gihyo.jp/book/2025/978-4-297-14931-4
- Pythonブートキャンプ[データ分析コース]
機械学習
-
座学
- ゼロから作るディープラーニング
https://www.oreilly.co.jp/books/9784873117584/
- ゼロから作るディープラーニング
-
実践
- 迷い中…まだ決められていません
その他
根拠のない話ではありますが「分野の本を20冊精読すればその技術の本質が掴める」という説があります。
本記事のゴールとしては5年後の技術習熟を目指していますが、5年で40冊(統計と機械学習で20冊ずつ)は少ないか?とも思うので、ひとまず「3年で40冊」をもう一つ影の目標として据えてみます。
最後に
現状あまりにも進んでいません。5年という期間設定とゴールの高さには正直不安もありますが、やれることを一つずつやるしかない。
幸い、現状の業務とは少しズレている分野なので、リフレッシュも兼ねて楽しく取り組めています。
気負わず、でも着実に進めていきたいと思います。