0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【機械学習の3つの学び方】教師あり学習・教師なし学習・強化学習を具体例で理解する

Posted at

はじめに

機械学習のアルゴリズムは「学び方」によって大きく3つの種類に分類できます。
今回は、講義で学んだ「教師あり学習」「教師なし学習」「強化学習」について、それぞれの違いを具体例を交えながらまとめてみます。

1. 教師あり学習 (Supervised Learning)

「問題(入力)」と「その答え(正解ラベル)」がペアになったデータセットを使って学習する方法です。答え付きの問題集で勉強するようなイメージです。

  • 目的: 未知のデータが来たときに、その「答え」を正しく予測すること
  • 例:
    • 分類: メールが「迷惑メール」か「そうでないか」を判定する
    • 回帰: 過去の販売実績データから「明日の売上」を予測する

2. 教師なし学習 (Unsupervised Learning)

「答え(正解ラベル)」が与えられていないデータから、データ自身に潜むパターンや構造を見つけ出す方法です。①と対照的で、答えなしの問題集で勉強するイメージです。

  • 目的: データの本質的な構造を理解すること
  • 例:
    • クラスタリング: 顧客の購買データを、似たような購買パターンのグループに自動で分ける

3. 強化学習 (Reinforcement Learning)

ある環境の中で、エージェント(学習する主体)が試行錯誤を繰り返しながら、より良い結果(報酬)を得るための行動を学習していく方法です。正解そのものを教えるのではなく、行動の結果が良かったか悪かったかをフィードバックするという特徴があります。

  • 目的: ある状況において、報酬を最大化するような一連の行動を学習すること
  • 例:
    • ゲームAI: 囲碁や将棋のAIが、自己対戦を繰り返して勝つための最適な指し手を学んでいく

まとめ

3つの学習方法を表にまとめると、以下のようになります。

学習方法 データの特徴 ゴール 例え
教師あり学習 正解ラベル付き 未知のデータの値を予測する 問題集と解答集で勉強する
教師なし学習 正解ラベルなし データに潜む構造やパターンを発見する 問題集のみで学習する
強化学習 環境と相互作用 試行錯誤を通じて報酬を最大化する 自転車の乗り方を練習する
0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?