つよい学習 よわい学習 そんなの ひとのかって
この記事の目的
教師あり学習、教師なし学習、強化学習について、それぞれ説明できるようになる。
教師あり学習(Supervised Learning)
「データ」と「正解」のセットを与えて学習させること。
人間が与えた回答を基に繰り返し学習することで、「データ」と「正解」の間にある関係性を見出すことができるようになる。
以下のようなタスクへ対処するときに使用される。
分類問題
分類という名前通り、データが所属しているカテゴリを推定する。
カテゴリという「選択肢」が決まっている場合にはこちらが使用できる。
(究極○か×で判断できるかどうか)
例えば…
- 受信したメールがスパムかそれ以外かを判別する
- 動物の画像を見て犬なのか猫なのかを判別する
回帰問題
過去の記録を基に、連続値を予測したいときに使う。
予測する答えが数値であるときに使用できる。
例えば…
- 株価の予想
- 明日の気温
関連単語
ロジスティック回帰
回帰という名前のくせに分類問題
その名前の理由は「何かが起こる確率」という数値を計算して、その結果をもとにどのグループに分類するかを決めるから。回帰の側面もあるんだね…?
教師なし学習(Unsupervised Learning)
「データ」のみ与えて、機械に自らパターンや類似性を見つけてもらう方法。データを整理したり、隠れた特徴やパターンを発見するのが得意。
「何も教えられないけど、似ているものをまとめてね」と言われるイメージ。いやな上司みたいだ…。
以下のようなタスクへ対処するときに使用される。
クラスタリング
似たもの同士をグループ分けする方法。分類問題と似ているので混ざらないように注意。
例えば…
- 買い物をする時間帯や買ったものの金額を基に、顧客をクラス分けする
K-means
クラスタリングの代表的な手法。
データを事前に指定した数(K個)のクラスに分ける。
クラスの中心を定め、データをその中心に最も近いクラスに割り当てていく。
たとえばK=3のときはあらかじめ3個のクラスを設定しておく。
最終的にまるいグラフになる。
次元削減
判断材料がたくさんあると複雑になってしまうので、データを圧縮してシンプルにすることで重要な情報を目立たせる方法。
例えば…
- 偏差値を求めるとき、十教科のテストの結果があるが、偏差値に関係のない科目を除いて五教科にする
主成分分析
データの分散が最も大きい方向を見つけて、新しい軸(主成分)を作り、その軸にデータを投影する方法。
重要な部分だけを抜き出して、少ない特徴で表現するのが目的。
異常検知
普通ではないデータを見つける方法。0点ばかりののび太くんがある日急に100点を取ったら「道具使っただろ!」って疑われるのと同じ。
例えば…
- クレジットカードの不正利用を見つける
- 工場などに配置されているセンサーの異常動作を見つける
強化学習(Reinforcement Learning)
試行錯誤しながら、自分の行動によって得られる「報酬」を最大化する方法を学んでいくこと。報酬は人間が与える。
例えば車の自動運転(試行錯誤を繰り返し、安全な運転と道を学んでいく)などに用いられる。
ざっくりまとめ
教師あり学習
「これが問題で、これが答え」と教えられて勉強する。
教師なし学習
自分でデータを見て、似たものをグループ分けする。
強化学習
試行錯誤を繰り返して、一番良い方法を見つける。