背景と目的
ChainerによるPythonの学習がひと段落しそうなので
計画の見直しをします
結論
下記で紹介する専門書を学習し、機械学習を使ったアプリケーションをアウトプットする。
頑張ります!!!
内容
##とりあえずさらっと学習済み
- 機械学習に必要な数学
- Python
- 機械学習に関する知識
- 微分(偏微分まで)
- 線形代数
- 基礎統計(平均、分散、標準偏差など)
- 単回帰分析の数学
- 重回帰分析の数学
- Python(Chainer)
- ニューラルネットワークの計算(順伝播), 線形変換, 非線形変換 ,ニューラルネットワークの計算(逆伝播)
誤差逆伝播法, 勾配降下法, ミニバッチ学習
##次に勉強予定(基本的に専門書で触る程度のことはできそう)
この本で勉強します
-
ニューラルネットワークの実装(TensorFlow もしくは PyTorch)
-
教師あり学習の代表的なアルゴリズム(書店をあさった結果、「機械学習」の専門書の勉強が必要そう)
重回帰分析, リッジ回帰, ラッソ回帰, ロジスティク回帰, k 近傍法, サポートベクトルマシン, 決定木, ランダムフォレスト, 教師なし学習の代表的なアルゴリズム, k 平均法, 主成分分析, ハイパーパラメータの代表的な調整方法, グリッドサーチ, ランダムサーチ, ベイズ最適化, 分類の代表的な評価指標, 正解率, 適合率, 再現率, F 値
##さらに次のステップ
下記は、作りたいプログラムに応じて適宜勉強したら良さそうなので、学ぶ順番としては今ではなくて後半になりそう
画像データ, 畳み込みニューラルネットワーク (CNN), 物体検出のアルゴリズム (R-CNN 、YOLO 、SSD など), セマンティックセグメンテーションのアルゴリズム, 文章データ, 文章データの特徴抽出方法(Bag of words 、Word2Vec など), 機械翻訳のアルゴリズム (Seq2Seq 、Attention など)
時系列データ(1/1 の来店者数は 100 人のデータに前後関係が存在するデータ)
再帰型ニューラルネットワーク (RNN 、LSTM 、GRU など)
畳み込みニューラルネットワーク (CNN)
表データ(Excel のシートに記載されるようなデータ)
特徴量エンジニアリング
発展的な機械学習アルゴリズム (XGBoost 、LightGBM など)