[前回] AWS公式資料で挑むMLS認定(4)-強化学習(Reinforcement Learning)
はじめに
今回は、AI/機械学習の学習手法とアルゴリズムのまとめと比較です。
AI/機械学習の全体像
機械学習モデルの学習手法まとめ
-
教師あり学習
- ラベル付きデータセット(サンプルと答えを含む)を使って学習
- モデルは徐々に学習し、正しい解を予測できるようになる
- 種類
- 回帰(Regression)
- 連続した値から将来を予測(線形または非線形)
- 分類(Classification)
- クラスに分ける(例えば0と1)
- 回帰(Regression)
- アルゴリズム
- Random Forest(ランダムフォレスト)
- 決定木(Decision tree)を弱学習器とするアンサンブル学習アルゴリズム
- アンサンブル学習とは、複数手法を同時利用し精度を上げる方法
- 用途
- 分類
- 回帰
- クラスタリング
- AdaBoost(アダブースト)
- 代表的なアンサンブル学習アルゴリズム
- 用途
- クラス分類
- 回帰
- Support Vector Machine(SVM: サポートベクターマシン)
- パターン認識モデルの一つ
- 用途
- 分類
- 回帰
- kNN(k近傍法)
- 特徴空間で最も近い訓練例に基づいた分類とパターン認識の手法
- 用途
- 分類
- 回帰
- Neural Network(ニューラルネットワーク)
- 相互接続する複数ノードからなる多層ネットワーク構造モデル
- 用途
- パターン認識
- 分類
- 回帰
- Logistic Regression(ロジスティック回帰)
- ベルヌーイ分布に従う変数の統計的回帰モデル
- 用途
- 線形分類
- 二値分類
- Liner Regression(線形回帰)
- 説明変数に対し目的変数が線形で表される予測モデル
- 用途
- 回帰分析
- Random Forest(ランダムフォレスト)
-
教師なし学習
- ラベルなしデータセット(サンプルのみ含む)を使って学習
- モデルはデータのパターンを徐々に学習し、それに応じてサンプルを編集
- 種類
- クラスタリング(Clustering)
- 類似するサンプルデータを部分集合(クラスタ)に分割し、データから隠れた構造を見つけ出す
- トピックモデリング(Topic model)
- テキスト本文の隠された意味構造を発見するテキストマイニングツール
- 次元削減(Dimensionality Reduction)
- 次元の呪い: 特徴量(データセットの次元)が多すぎると、計算コスト増加し、精度悪化
- 特徴量を抽出することで、データセット内の特徴量を削減
- クラスタリング(Clustering)
- アルゴリズム
- PCA(Principal Component Analysis: 主成分分析)
- 主成分分析により、次元削減
- k-means(k平均法)
- 非階層型クラスタリングのアルゴリズム
- サンプルデータをいくつのクラスターに分けるかを事前指定
- 指定されたクラスター数に基づきサンプルを分割
- 非階層型クラスタリングのアルゴリズム
- t-SNE(T-distributed Stochastic Neighbor Embedding、t分布型確率的近傍埋め込み法)
- 高次元データを2次元や3次元に落とし込むための次元削減アルゴリズム
- PCA(Principal Component Analysis: 主成分分析)
-
強化学習
- コンピュータープログラム(エージェント)が環境と相互作用し、シミュレーションを行う
- エージェントは行動に応じて正または負の報酬を得る
- 報酬は、行動の良し悪し表す数値表現を出力するユーザー定義関数によって計算
- 報酬を最大化することで、エージェントは最適な意思決定の戦略を学ぶ
教師あり学習 vs. 教師なし学習
- トレーニングデータが異なる
- 教師あり学習
- 正解ラベルを付けたデータを使用し学習
- 典型例: 動物画像認識(正解の動物名を付けた画像データで学習)
- 教師なし学習
- 正解ラベルを付けていないデータを使用し学習
- 典型例: 購買情報を基に顧客を分類(正解は存在しない)
- 教師あり学習
- 特徴と用途が異なる
- 教師あり学習
- 教師データを使用することで、モデル精度を高める
- 確固とした正解のある問題を自動的に解決させたい
- 教師なし学習
- 大量データの規則性や傾向を分析、似ているものをグルーピング
- 正解を問わず、膨大なデータから特徴を把握しグルーピングしたい
- 教師あり学習
強化学習 vs. 深層学習
- 学習方法が異なる
- 強化学習
- 学習プロセスに人間の命令を必要とする
- 何を学習するかまでは、コンピュータが判断しない
- 深層学習
- コンピュータ自身が注目すべきポイントを入力データから見つけ出す
- 自ら分析して学習を進める
- 強化学習
- 特徴と用途が異なる
- 強化学習
- 報酬を最大化する目的で、試行錯誤を繰り返し、最適な制御方法を決定
- 自動運転、自動制御システム
- 深層学習
- 人間の脳を模倣した
ニューラルネットワーク
を利用し、繰り返し重みを調整し、精度の高い予測を実現 - 顔認識、音声認識
- 人間の脳を模倣した
- 強化学習
おわりに
AI/機械学習の各種手法とアルゴリズムを比較しました。
次回から、AWSの関連サービスを勉強します、お楽しみに。