前回の内容
教師あり学習① 概要
前回まではアイリスのクラス分類ということで、大量のアイリスデータを元に、野生のアイリスを推測するモデルの構築をしてきた。
これはいわゆる、教師あり学習という枠の機械学習である。
ここからは、教師あり学習についてさらに踏み込んでまとめていく。
教師あり学習とは?
ある入力に対して、特定の出力を予測したいケースの時に、入力と出力のペアがすでに入手可能である場合に用いられるパターンである。
一般的に、教師あり学習で学習させる際はかなりの工数がかかるが、ひとたび学習が終われば、その労力に見合った働きをしてくれる。
クラス分類と回帰について
教師あり学習で解く問題は大きく分けて、クラス分類と回帰に分類できる。
クラス分類とは、予め定めておいたいくつかのクラスに新しいデータを分類すること。
一方、回帰とは、連続値を予測する際に用いられる。(こちらわかりづらいので後程詳細に)
クラス分類の種類
回帰に突っ込む前に、まずはクラス分類について。
クラス分類は、その中でも2クラス分類と他クラス分類に分けられる。
これは単純で、分類するクラスラベルが2つ(YesかNoか)か、3つ以上かの違いだけである。
回帰について
これがパッと見わかりづらい。
回帰とクラス分類を見分ける際は、その期待値がある程度大雑把でも問題ないかが一つの基準点になりそうだ。
例えば、住所・年齢・性別データから、年収を予測するような場合は、答えが1000万円でも、1000万1円でも、予測値としてはどちらでもよい。
これは回帰問題と分類することができる。
逆に、多クラス問題は、固定したクラスのどれかには必ず属さなければならないので、間違いがあると精度に大きく響くことになる。
#教師あり学習① 所感
初見の状態だと、回帰が分かりづらかった印象がありました。
ただ、クラス分類と対比することで、理解が深まりました。
機械学習で解決する問題としては、どちらもよくあるパターンだと感じたので、ここは自分の中で納得がいくように理解しておく。
次回記事
Pythonではじめる機械学習 part6(準備中)