密度推定
密度推定は、教師なし学習です。
『データがどのように分布しているかをモデル化する方法』
密度推定を使うことで、新しいデータが
- 「どのくらい普通か」
- 「どのくらい異常か」
を判断することができるため、 異常検知 などにも応用されます。
密度が高い
エリアにデータが多く集まっている。
密度が低い
エリアにほとんどデータがない。
例
- りんごとオレンジの色や形のデータを収集したとします。密度推定とは、このデータからりんごやオレンジの一般的な色や形の特徴を分析することです。
- 新しく観測したフルーツがりんごやオレンジの一般的な特徴から大きく外れる場合、そのデータは「密度が低い」エリアに位置すると判断できます。
- つまり、異常データ(りんごでもオレンジでもない別の果物)である可能性が高いと推測できます。
