機械学習に関する基本的な内容をまとめてみたものです。機械学習に関する、Web上にすでにある解説コンテンツをまとめたサイトの抜粋です。
[機械学習における二項分類と多項分類] (https://www.techcrowd.jp/machinelearning/classifications/)
[機械学習に用いられる二項分類と多項分類] (https://www.techcrowd.jp/machinelearning/classifications/)
機械学習には複数の学習アルゴリズムが存在しますが、特定の属性に注目してデータを分類する方法として、二項分類と多項分類があります。
二項分類
・属性によって、二種類に分類する
・具体例 奇数か偶数か、0か1かなど
多項分類
・属性に応じて、三種類以上に分類する
・具体例 色による分類、商品の種類による分類など
[二項分類による予測] (https://www.techcrowd.jp/machinelearning/classifications/)
データを二種類のグループに分類する二項分類では、判断の材料として使われるのが分類閾値(カットオフ)です。
閾値とデータを比較した結果を元にして、予測が行われます。
二項分類の結果を評価するために用いられる精度メトリクスには、
・Accuracy(正確度)
・Precision(精度、適合率)
・Recall(再現率)
・False Positive Rate(偽陽性率)
・F1-measure(F1値)
などがあります。
これらの値を検証する事で、より正確に二項分類出来るように修正する事が出来ます。
[多項分類による予測] (https://www.techcrowd.jp/machinelearning/classifications/)
多項分類は、単にデータと閾値を比較するのではなく総合的なスコアによって、分類を行います。
状況によっては、一定の値以上のスコアにならない時は、予測出来ない事もあります。
多項分類でも二項分類と同じように、Accuracy(正確度)やPrecision(精度、適合率)などの精度メトリクスを使って、予測した結果を評価します。