記事中央に時間割を作っていますが、画像に講座リンクが繋がっています。
#0. 対象読者
・データサイエンス,統計,機械学習,AIに興味あり
・大学時代に専攻していなかった
・学習に大金を費やすのは難しい
・独学が厳しい領域だと感じている
・中学生の初級レベルの英語ならわかる
この記事を読むのに向いてない方
・英語を一切学ぶつもりはない
・データサイエンス分野に興味が無く、簡単に概要だけ知りたい
(この場合はお金をかけて入門講座や家庭教師を頼んだ方がいい)
#1. はじめに
##1-1. まだまだ自学しよう
2020年の5月にタダで学べるデータサイエンス名著5冊を記事として書きました。
続編です。
この頃にはウイルスも8月までには収まっているだろう。という根拠のない予測をしていましたが、
まだ自粛ムードが漂う。
きっとデータサイエンティストを目指して入社した新卒の方もいらっしゃるでしょう。
採用した側としても早く教えて一人前にしたいわけですが、
蔑ろにしている、手持ち無沙汰を感じている方もいらっしゃるのでは?
##1-2. 創造的休暇にしよう
有名なニュートンもペスト流行で外出自粛の時期に大発見をしたといわれています。
時間の取れる今こそ、大学と同じレベルの教育で自分磨きしましょう。
仕事が不安定ならデータサイエンス分野はまだ、キャリアチェンジできる領域と思います。
##1-3. courseraって?
couseraとはスタンフォード大のAndrew NgとDaphne Kollerによって創立されたオンラインの教育団体です。
学位を求めなければ基本無料で受講可能です
ほぼすべて英語
(後述しますが、怖がる必要はないです)
Andrewさんはメディア露出も多く、機械学習の界隈では有名な方です。
(ちょっと前にNgboost出してましたね)
couseraの機械学習の有名なコースを担当している先生でもあります。
courseraでは有名大学がオンライン学位、教育の普及のために動画やプログラミング課題を公開してくれています。
##1-4. でも英語やん?
・有名講座にはボランティアの訳した日本語字幕がついている
・自動翻訳の字幕が表示される
・字幕が無くても英語スクリプトが表示されるので翻訳して聞けばいい
・技術的な話はいくつかの用語で大体話が理解できる
・聞いてるとヒアリング力が自然とつきます~~(ロシアやスペインなまりは聞き取れないのであきらめて翻訳してます)~~
英語勉強してからでなければ!とか思わず初めてみてください。
どうしても準備したい人はNetf〇ixとかで好きな海外ドラマを音声だけ英語にして見る習慣をつけましょう。
##1-5. データサイエンス系ならどれを受けたらいいの?
courseraは様々な分野の学習コンテンツが揃えられています。
本記事では特にデータサイエンスに関わるコンテンツをレベル順に大学の時間割っぽくまとめました。
半年強ほどでデータサイエンスの分野で**「まともに話せる & 使えるレベル」になることも夢ではない**ように選んだつもりです。
私自身、学生時代に一切の数学や計算機科学の分野に関わってきませんでしたが、courseraに助けられています。
無料で受講可能な講座を選びました。
費用が心配な方でも是非登録してみてください。
右上に登録ボタンがあるので情報を登録してログインしましょう。
##1-6. 無料登録ができない?
###step1
・受けたいコースを見つけて、無料登録を押す
###step2
・お金がかかったり、クレジットカード登録を求められる。
・トライアルも期間を過ぎると自動課金になるので、ひとつ前のページへ戻る。
###step3
・コースのタブを押して各コースに飛びましょう
###step4
・特定のコースにたどり着いたら「聴講」や「監査する」といったボタンが出てきます。
・課題などはロックされていますが基本的な動画コンテンツは確認ができます。
日本の大学も入学前に授業がこのレベルで見学出来たらいいんですが・・・
couseraは営利団体なので、スキルアップして収入が上がった際は「coursera plus」に登録して皆で支えましょう!
#2. 本編:カリキュラム組んでみた
学習の順番を考えながらオススメを組んでみた。
他の優良講座もあるだろうが見逃しているので、オススメがあればコメント欲しい。
あと、ここに表示しているコースの半分くらいは私はまだ完走できていないので説明が間違っていてもユルシテ。
講座は1 week × 10 course のように30時間くらいで終わるものもあれば、
5 week × 12 courseのような重いものもありますので、ご自分で調節しながら受講してみてください。
##2-1. courseraで勝手にデータサイエンス学部 前期
前期では「機械学習と数学の関係性」を主題としてカリキュラムを組んでみました。
- 必要な数学的知識を学びながらRとpythonを使ってモデル作成を行っていきます。
- 理論を学んで、実際に数字が変化していく様を確認するのは極めて有効と感じます。
- どのタイミングで数字がどう変わっているのか
- 理論から自分で実装した場合と、パッケージの結果が等しくなるか
- 作ったモデルで実データに当てはめる
- とにかく理解のために可視化する
- 学んだ計算ができるようになっておく
- 以上を念頭に学習を進めます
##2-2. courseraで勝手にデータサイエンス学部 中期
中期では「広い機械学習知識と時系列」を主題としてカリキュラムを組んでみました。
- 前期で学んだ理論やプログラミングスキルを使って
- 授業内容に類似するパッケージを探す
- 自分で実装してみる
- 別言語で実装しているものをRやpythonへの変換を考えてみる
- 時系列
- 確率過程、ガウス過程等を理解して時系列データへのアプローチを学ぶ
- ACF,PACFなど時系列特有の統計量を学ぶ
- 時系列ならではの検定、モデリングの考えを理解する
- 統計や確率、ベクトルの考え方をもとに時系列データに対応できるようにする
- kagglerを目指すならばAdvanced Machine Learningのkaggleコースは必見
教科 | ML,DL | 確率過程,時系列 |
---|---|---|
1限 | ||
説明 | Machine learning | Stochastic processes |
2限 | ||
説明 | Deep Learning Specialization | Practical Time Series Analysis |
3限 | -blank- | |
説明 | Advanced Machine Learning | -none- |
##2-3. courseraで勝手にデータサイエンス学部 1回生後期
後期では「より高度な数学知識、思考能力の強化と実社会の専門性」を主題としてカリキュラムを組んでみました。
- 高度な機械学習を使いこなすために必要な分野を集めました
- 解析学
- 証明の方法
- 最適化数理
- 組み合わせ数学
- グラフ理論
- MCMC,確率伝播
- 経済金融は実社会で誰にでも関係のあるお金に関わる問題
- お金に関する知識は教養として持っていて損はない
- AIを使ってお金について考える
- 中期までで登場しなかった強化学習や再帰型の深層学習を使って学ぶ
|教科|数学基礎|ベイズ統計,グラフ理論|金融,経済,ML|
|---|---|---|---|---|---|
|1限||||
|説明|Mathematics for Data Science|Bayesian Statistics: Mixture Models|Reinforcement Learning for Trading Strategies|
|2限||||
|説明|Introduction to Discrete Mathematics for Computer Science|Probabilistic Graphical Models|Finance & Quantitative Modeling for Analysts|
##2-4. courseraで勝手にデータサイエンス学部 自由選択科目
ここからは専門領域に合わせて受講しましょう
- 金融:金融や経済、時系列をより強く学びたい場合
- 生命科学:公衆衛生、分類、リスク評価、生存分析など臨床に役立つ知識、遺伝学
- 熱力学:流体力学、量子などの言葉にピンときた場合
- IT技術:開発、DevOps、クラウド、分散コンピューティング、インフラに関係がある場合
- 専門数学:もう趣味でいいんじゃないかな、代数方程式、群、体、全探索アルゴリズム
教科 | 専門数学 | 医学,生命科学 |
---|---|---|
1限 | ||
説明 | AI for Medicine | Introduction to Galois Theory |
2限 | ||
説明 | Statistical Analysis with R for Public Health | game theory |
3限 | -blank- | |
説明 | Big Data, Genes, and Medicine | -none- |
#3. 最後に
英語も分かるようになれば一石二鳥。
自分で本を読むよりも、動画で話している内容と板書の図を見ていると理解できることがあります。
これだけ体系的に整った内容はyoutubeを探してもなかなか出てきません。
疑問に思った部分をyoutubeやネットを使って検索すると、さらに理解しやすくなるでしょう。
上記講座を受講された際は、学習した内容のアウトプットを共有していただけるとありがたいです。
オススメ講座などもお待ちしております。