#Level4.機械学習講座(理論と実践)
##4-5.k近傍法(kNN)
###4-5-1.k近傍法(kNN)とは
●分類問題のための機械学習手法である。
最近傍のデータを$k$個取得し、もっとも多く所属するクラスに識別する。
$k=3$と決めた時に、あるデータから最も近いデータを3個選択する。
その中で、分類できる同じクラスに多く所属するものとして識別する。
(例)あるデータから最も近いデータ3個のうち、
赤い点2個と、青い点1個が選択された場合は、自分自身は赤い点のクラスとする。
●$k$は、アルゴリズムを回す前に決めておく必要がある。
●$k$を大きくすると決定境界は滑らかになる。
###4-5-2.ハンズオン
●人口データを分類する。
###4-5-3.考察
データの分布状況を確認してから$k$の値を設定した方が良いのか、
初期値はこのくらいと決める方法があるのかは勉強してみようと思います。
知識としていた部分だったので、動かしてみて勉強になった。