#動画3本と本1冊で大体わかるようになる
みたいなコンセプトで書いてみる
##オススメの動画
3本で1時間。これだけ見れば先ずはOK
- まずは動かしてみる:「【機械学習超入門】初心者はまず動くモデルを作る」
- ディープラーニングのさわりがわかる:「内職が要らないくらい分かりやすいディープラーニング入門」
- pythonのライブラリを学ぶ入り口:「【機械学習超入門】scikit-learnについて【知っておきたいライブラリ】」
##オススメのPythonの本
毎日5本くらいノックを受けてみる。ググりながらでも多分いけるが、体系的に知っておいたほうが、結局最短距離になると思う。
- とにかく触ってみる「Python実践データ分析100本ノック」
#結局何がわかるようになれば良いのか
上記をやると、以下のようなものが身につく。
- Pythonを書いてみてモデルを作って予測したという経験
- Kaggleのサイトに行けば色々なデータを入手・Tryできることを知っておくこと
- アルゴリズムってどういうイメージなのかという感覚
- アルゴリズムは、最適化問題を解くもの。という感覚
- 回帰とか勾配ブースティングなどのなんとなくの仕組みとユースケース
- データの前処理
- One Hot Encodingとか、正規化とか
#番外編
##書き溜めていく箱てきなもの
次にわかるようになるべきもの
- XGBoostの例
- ハイパーパラメータのチューニング項目、カーネルとかも
もうあまり勉強しなくてもよくなる?かもしれない理由
- よしなに機械学習してくれる環境が増えてきている
- AutoML
- DataRobot
- AWS Forecast
- よしなに機械学習してくれるライブラリ(アルゴリズムの実装)が多く出てきている
- scikit-learnとか、XGBoost/LightGBMとかそういうの
- アルゴリズムの仕組みというよりは、ユースケースレベルでの理解で十分
今後注力していきたいもの
- MLOpsみたいなデータ収集〜加工〜学習みたいな流れの効率化・自動化
- 2020/6/8勉強したので追記:AWSデータ分析系ツールまとめ(AI+BI=MLOps)
- AIOpsみたいなシステム開発のプロセスにAIを
- 2020/6/8追記:AI系のコミュニティで発表する予定がコロナ影響で中止
- IoTとかデバイス系