教師あり学習
『正解ラベル付きのデータ』
を用いて学習します。
教師なし学習
『ラベルのないデータ』
を基にデータの構造やパターンを学習します。
教師あり学習 | 教師なし学習 |
---|---|
ラベル付きデータを使用する | ラベルなしデータを使用する |
明確な目的に対して結果を出す | データの隠れた特徴を発見する |
スパム検出、感情分析、価格変動予測 | 画像生成、異常検知 |
線形回帰、ランダムフォレスト、SVM | PCA、GAN |
強化学習
『試行錯誤を通じて最適な行動を学習する手法』
動的な環境での最適な意思決定やロボット制御、ゲームAI、物流最適化など、多くのユースケースで活用されています。
例えば、ある企業が、AIモデルを使用してロボットを制御し、迷路内で最適なルートを学習させたいと考えています。このような動的環境で、試行錯誤を通じて報酬を最大化するために強化学習を利用します。