はじめに
機械学習のアルゴリズムは「学び方」によって大きく3つの種類に分類できます。
今回は、講義で学んだ「教師あり学習」「教師なし学習」「強化学習」について、それぞれの違いを具体例を交えながらまとめてみます。
1. 教師あり学習 (Supervised Learning)
「問題(入力)」と「その答え(正解ラベル)」がペアになったデータセットを使って学習する方法です。答え付きの問題集で勉強するようなイメージです。
- 目的: 未知のデータが来たときに、その「答え」を正しく予測すること
- 例:
- 分類: メールが「迷惑メール」か「そうでないか」を判定する
- 回帰: 過去の販売実績データから「明日の売上」を予測する
2. 教師なし学習 (Unsupervised Learning)
「答え(正解ラベル)」が与えられていないデータから、データ自身に潜むパターンや構造を見つけ出す方法です。①と対照的で、答えなしの問題集で勉強するイメージです。
- 目的: データの本質的な構造を理解すること
- 例:
- クラスタリング: 顧客の購買データを、似たような購買パターンのグループに自動で分ける
3. 強化学習 (Reinforcement Learning)
ある環境の中で、エージェント(学習する主体)が試行錯誤を繰り返しながら、より良い結果(報酬)を得るための行動を学習していく方法です。正解そのものを教えるのではなく、行動の結果が良かったか悪かったかをフィードバックするという特徴があります。
- 目的: ある状況において、報酬を最大化するような一連の行動を学習すること
- 例:
- ゲームAI: 囲碁や将棋のAIが、自己対戦を繰り返して勝つための最適な指し手を学んでいく
まとめ
3つの学習方法を表にまとめると、以下のようになります。
| 学習方法 | データの特徴 | ゴール | 例え |
|---|---|---|---|
| 教師あり学習 | 正解ラベル付き | 未知のデータの値を予測する | 問題集と解答集で勉強する |
| 教師なし学習 | 正解ラベルなし | データに潜む構造やパターンを発見する | 問題集のみで学習する |
| 強化学習 | 環境と相互作用 | 試行錯誤を通じて報酬を最大化する | 自転車の乗り方を練習する |