はじめに
きっかけ
新型コロナウィルスが蔓延したことで、自宅に閉じこもる時間が多くなり、「新しいことを勉強する良い機会かぁ・・」と思い、機械学習の勉強を開始した。
勉強開始からしばらく経つため、復習がてら内容について簡単にまとめてみた。
勉強方法
-
Coursera(機械学習コース)の受講
「何から始めればよいか・・」と思いググってみると、Coursera(機械学習コース)が好評で、無料ということもあり受講してみた。
機械学習のアルゴリズムの理解には、微分/積分、線形代数などの数学の知識が必要となるが、本コースは、その辺が丁寧に解説されているので、数学が苦手な人に特におすすめ。
※講師はスタンフォード大学の教授なので全て英語だが、字幕つけれる。 -
youtubeの視聴
数学的理論なんかはyoutubeで分かりやすく解説されている。文書を読むことに疲れた人、動画で勉強したい人におすすめ。
予備校のノリで学ぶ「大学の数学・物理」が幅広くカバーされているのと分かりやすいので個人的におすすめ。 -
参考書を読む
何冊か読みました。好き嫌いがあると思うので書店で自分に合ったやつを探してください。
機械学習
機械学習とは?
機械に大量の情報(データ)から、そこに潜むパターンを覚えさせ(学習)、未知のルール(モデル)を獲得させる技術のこと。
人間には複雑すぎたり、認識していないことでルールを設定できない課題を解決するアプローチが機械学習といえる。
因みに、定義としては、AI(人工知能) > 機械学習 > ディープラーニングであり、AI(人工知能)技術が内包する分野のひとつであるため注意。
機械学習の分類(教師あり学習・教師なし学習・強化学習)
機械学習は以下の3つに分類される。
-
教師あり学習
正解付きのデータセットを機械に学習させることで、未知のデータの正解を予測する学習方法。
例えば、犬と猫の画像とその正解を機械に学習をさせることで、未知の犬と猫の画像の正解を予測する分類、他にも、過去の店舗の売上と入店者数や天気といった情報を機械に学習させることで、売上のパターンをつかみ、未来の店舗の売上を予測する回帰が、教師あり学習の代表的な手法に挙げられる。 -
教師なし学習
正解がないデータを機械に学習させることで、類似したデータをグルーピングしたり、仲間外れのデータを検知する学習方法。
例えば、ラベリングされていない大量の記事を「政治」「経済」「エンタメ」「スポーツ」といったジャンルごとに自動でグループ分けをするクラスタリングが、教師なし学習の代表的な手法に挙げられる。 -
強化学習
機械に試行錯誤させることで、目的達成のための最適なルールを構築する学習方法。
迷路を例とすると、各地点ごとで上下左右の選択肢が存在するが、各地点、各選択肢に対する報酬(選択肢の良さ)が最大化するように繰り返し学習をさせることで、ゴールに対する最短経路を導き出す。
次回
次回は、教師あり学習の回帰についてまとめる。
→ 機械学習についてまとめ(その2)