search
LoginSignup
180

More than 1 year has passed since last update.

posted at

updated at

ど素人初学者データサイエンティストロードマップまとめのまとめ

はじめに

データサイエンティストを志してみようと思っていろいろ調べたけど、ロードマップを調べても情報が多くてどれをやればいいかわからなくなったので頭の整理も兼ねて初めて記事を書いてみました。
多分知識がついたら増えるので加筆修正します。
初学者なので的外れな部分もあると思いますが、こんなのが足りないとか教えていただいたら加筆したいと思います。

筆者スペック

・MARCH文系卒
・学部は経営学部
・30代前半
・新卒で商社で7年、メーカーで3年営業 現在3社目
・プログラミング歴0

データサイエンティストを目指すきっかけ

・会社に仕事をさせてもらう人生ではなく自分で仕事を選べるようになりたいという目標の為。
・転職を繰り返した結果待遇は生活できるぐらいにはなったけど、
 これからの人生とか考えた時に転勤とか含めどうしても会社に身柄を拘束された人生しか見えなかったこと。
・結婚とか考えた時に収入を増やしたい。
・犬を飼いたい
・資格の勉強したりエンジニアのこと調べたりしたけど、一番自分に合っていそうと思ったため
・営業でもデータとかエクセルに一杯入力してにやにやすることが好きだったため

この記事を書くきっかけ

色んな方が未経験からのデータサイエンティストへのロードマップを書いて下さっているが、
結構書いてることがばらばら(特に勉強資料やどこまで勉強するか)だったので頭の整理をしたかった。
調べたことをざーっと羅列していきたいと思います。
理解が深い人はいろいろ教えていただけると助かります。

データサイエンティストロードマップ 大枠

必要スキル
・データサイエンスに関する知識
・プログラミングスキル(python)
・データベースの知識(SQL)
・統計学の知識
・数学の知識
・機械学習の知識
・kaggleのようなコンペでの実績(実務経験)
・BIツールを使える
・データサイエンスするためのツール(まだよくわかってない)多分DockerとかNumpyとかPandasとか。
・ビジネススキル

習得すべき内容

データサイエンス知識
データサイエンスとはなんぞやがわからないとそもそもだめだと思いました
プログラミング
・pythonは必須と思われる、これができないと何もできない。
・SQLもできないと何もできないらしい。
・タッチタイピングもできないとダメ
数学
機械学習でも統計学でも使う
Udemyのpythonとか機械学習講座で一緒に教えてくれるものもある
統計学
・分析手法の理解、選定に必要。
・まずは統計検定2級レベル
機械学習の知識
・まだ未勉強のためどこまで必要か把握できず
コンペ実績
データサイエンティストは実務経験ないと求人がないからそもそも経験詰めないという状況らしいのでコンペで何かしら実績を出す必要がある。
BIツール
power BIとかTableau
データサイエンスするためのツールを使えるようにする
実際の現場で使えるスキルを身に着ける
ビジネススキル
分析結果をうまいことまとめて報告できる

勉強法

本記事のメインコンテンツ。
勉強法というかどれを勉強したらよいというのがあふれていてたり結構かぶっていたりなので勉強することをまとめたい
もちろん全部やるわけではないです。
プログラミング(データ分析含む)
progate
 ほぼすべてのサイトで初学者におすすめされている。
 python以外にもいろいろある
pyq
 Pythonに特化しているサイト。ツールの使い方も教えてくれるらしい。
ドットインストール
 progateの次のレベルぐらいらしい。動画で短く教えてくれるとのこと。
Udemy
 世界中のすごい人が売り切りで教えてくれる。
 以下おすすめされていたもののまとめ。多分入門編はこの辺
 【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門
  現役シリコンバレーエンジニアが教えるPython 3 入門 + 応用 +アメリカのシリコンバレー流コードスタイル
 【世界で34万人が受講】データサイエンティストを目指すあなたへ〜データサイエンス25時間ブートキャンプ〜
 【世界で18万人が受講】実践 Python データサイエンス
 はじめてのSQL ・データ分析入門 -データベースのデータをビジネスパーソンが現場で活用するためのSQL初心者向コース
 
・本
 東京大学のデータサイエンティスト育成講座 ~Pythonで手を動かして学ぶデ―タ分析~
 Python実践データ分析100本ノック
 Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
 Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理
 リーダブルコード ―より良いコードを書くためのシンプルで実践的なテクニック
 データ解析のための統計モデリング入門

統計学
統計学の時間
 とりあえずこれを勉強
・統計検定2級を取る
・Udemy
 【ゼロからおさらい】統計学の基礎
・本
 統計学がわかる
 図解・ベイズ統計「超」入門 あいまいなデータから未来を予測する技術
 マンガでわかる統計学
 「それ、根拠あるの?」と言わせないデータ・統計分析ができる本
 Rによるやさしい統計学
 心理統計学の基礎―統合的理解のために
 基本統計学
 多変量解析法入門
 統計学入門
 完全独習統計学入門
 完全独習 ベイズ統計学入門

統計学は奥が深そうでドツボにはまりそうなのでとりあえず入門書から始める予定

数学
・Udemy
AIのための数学講座:少しづつ丁寧に学ぶ人工知能向けの線形代数/確率・統計/微分
線形代数の理論とPythonによる実践
スバラシク実力がつくと評判のラプラス変換キャンパス
フーリエ解析キャンパス・ゼミ
・本
微分積分キャンパス
線形代数キャンパス
これなら分かる最適化数学―基礎原理から計算手法まで

機械学習
・udemy
【キカガク流】人工知能・機械学習 脱ブラックボックス講座 - 初級編 -
【キカガク流】人工知能・機械学習 脱ブラックボックス講座 - 中級編 -
 みんなのAI講座 ゼロからPythonで学ぶ人工知能と機械学習
・本
  言語処理のための機械学習入門 (自然言語処理シリーズ)
 はじめてのパターン認識
 Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎
 ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

コンペ
kaggle
SIGNATE
Kaggleの本
Kaggleで勝つデータ分析の技術

BIツール
・Udemy
 データサイエンティストを目指す人のための『ゼロからの Tableau 入門』
 Microsoft Power BI - Power BI Desktop入門講座
その他おそらく必要な勉強
Docker
pandas
Numpy
matplotlib
scikitlearn
Django
Github
多分この辺?
2月8日本を少し追加
2月9日数学について追記

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
What you can do with signing up
180