はじめに
AI技術の進歩が目覚ましく、日々新たなアルゴリズムや応用事例が登場しています。
私自身もLLMのアルゴリズムを学習中で、Notionにまとめた内容が少しずつ充実してきました。
せっかくなので、同じように勉強されている方のお役に立てればと思い、まとめたものを記事にして公開します!
補足①:ML の中での NN 利用/非利用について
- 「ML (non-NN)」は、ニューラルネットを使わない従来型の機械学習アルゴリズム(決定木、SVM、回帰分析、クラスタリング、ARIMA など)。
- 「ML (NN-based)」は、強化学習の中で深層ネットワークを方策学習に利用するなど、ニューラルネットを活用する実装が主流になっている手法。ここでは典型例として PPO を挙げました。
- ただし、強化学習全般が常にNNを使うわけではありません(Q-learning などは非NNで実装可能)。
- 一方でDeep Q-Network(DQN)のようにNNベースに拡張する方法もあり、実際には境界が曖昧です。
補足②:DL と LLM の境界
- 「LLM」は巨大なTransformerベースモデルを想定しており、技術的には深層学習(DL)の一種ですが、分かりやすさのために「自然言語処理専用の大規模モデル」として別枠にしています。
- 「DL」は主に画像・音声・生成モデルなど多分野を含む深層学習手法全般を扱っています。
本記事では 便宜的に分割 することで読みやすく整理していますが、
それぞれの領域が完全に独立しているわけではない点にご留意ください。
ML/DL/LLMアルゴリズム一覧表
ML/DL/LLM | 学習手法 | カテゴリ | 代表的アルゴリズム | ビジネス活用例 | 学習のポイント |
---|---|---|---|---|---|
ML (non-NN) | 教師あり学習(分類) | 分類 | ロジスティック回帰 (Logistic Regression) | - スパム判定 - 倒産予測 - 医療診断 |
- 分類の基礎 - 線形モデルの理解 |
決定木 (Decision Tree) | - 客層分析 - 住宅ローン審査 - 簡易な意思決定支援 |
- ルール可視化 - 過学習とプルーニングの学習 |
|||
ランダムフォレスト (Random Forest) | - 不正取引検知 - 製品品質分類 - 複数特徴量での分類 |
- アンサンブル学習の理解 - 汎化性能向上の手法 |
|||
XGBoost / LightGBM / CatBoost | - CTR予測 - 売上予測(ツリー+ブースティング) |
- ブースティングの仕組み - パラメータチューニング |
|||
教師あり学習(回帰) | 回帰 | 線形回帰 (Linear Regression) | - 売上予測 - 金融リスク評価 - 価格推定 |
- 回帰分析の基礎 - 特徴量エンジニアリング |
|
SVR (Support Vector Regression) | - 株価予測 - 需要予測 - 非線形回帰 |
- カーネル法の理解 - SVMの回帰版学習 |
|||
教師なし学習 | クラスタリング | k-means | - 顧客セグメンテーション - 行動ログのグルーピング |
- クラスタリングの可視化 - クラスタ数のチューニング |
|
DBSCAN | - 異常検知 - ノイズ点の自動分離 - 非球状クラスタ検出 |
- 密度ベースクラスタリングの理解 - ε近傍の設定 |
|||
次元削減 | PCA (主成分分析) | - 高次元データの可視化 - 要因分析 - ノイズ除去 |
- 分散最大化 - 主成分の解釈 |
||
強化学習 | 価値ベース (Q学習) | Q-learning / SARSA | - 簡単なゲームAI - 迷路探索 |
- 強化学習の基礎 - 状態・行動価値関数の習得 |
|
ML (NN-based) | 方策ベース | PPO (Proximal Policy Optimization) | - ロボット制御 - 倉庫内移動最適化 |
- 方策勾配法の実装 - 大規模環境での安定学習 |
|
ML (non-NN) | 時系列分析/予測 | 時系列予測 | ARIMA / SARIMA | - 売上予測 - 株価予測 - 季節性のある需要予測 |
- 伝統的時系列解析 - ACF/PACFの学習 |
Prophet (Facebook社) | - 休日考慮の売上予測 - マーケ施策効果の把握 |
- ビジネス向け時系列予測 - Seasonality/ホリデー効果の理解 |
|||
DL | 教師あり学習(深層学習) | 画像認識(CNN) | ResNet | - 製造業での外観検査 - 画像分類(犬・猫判定など) |
- CNNの基本構造 - Skip Connectionの理解 |
MobileNet / EfficientNet | - リアルタイム推論 - スマホ・組込デバイス上の軽量推論 |
- モデルの軽量化 - ネットワーク設計の最適化 |
|||
音声認識 | RNN / LSTM | - コールセンターの通話録音文字起こし - 音声感情分析 |
- シーケンスモデルの基礎 - 勾配爆発/消失問題の対処 |
||
Transformer ASR (Wav2Vec2, Conformer) | - 自動字幕生成 - 車載音声コマンド解析 |
- Transformerの応用 - エンドツーエンド音声認識 |
|||
自己教師あり学習 | 画像表現学習 | SimCLR / MoCo | - ラベルなし画像から特徴抽出 - 下流タスクの精度向上 |
- コントラスト学習の仕組み - 正例/負例ペアの作り方 |
|
MAE (Masked Autoencoder) | - 大規模画像事前学習 - ラベル不足分野の特徴量獲得 |
- TransformerベースのAutoencoder - マスク再構成の学習 |
|||
生成モデル | VAE系 | VAE (Variational Autoencoder) | - 画像生成 - 潜在空間操作 - データ拡張 |
- オートエンコーダの拡張 - 潜在変数モデルの理解 |
|
GAN系 | StyleGAN | - 高解像度顔画像生成 - プロダクトデザイン(衣服, 家具など) |
- GANの仕組み - 潜在空間変換(Styleブロック) |
||
Diffusion系 | Stable Diffusion | - テキスト→画像生成 - 広告クリエイティブ作成 |
- 拡散モデルのプロセス - 画像生成の最新技術 |
||
転移学習 | 事前学習 | ResNetなどのFine-Tuning | - 医療画像分類 - 特殊ドメイン(少量データ)の高精度化 |
- 事前学習モデルの微調整 - 特徴抽出とフリーズ層の設定 |
|
マルチタスク学習 | 同時学習 | MMoE (Multi-gate Mixture-of-Experts) | - レコメンド(CTR+CVR同時予測) - 広告表示最適化 |
- マルチタスクのパラメータ共有 - エキスパート混合の仕組み |
|
メタ学習 | Few-Shot学習 | MAML (Model-Agnostic Meta-Learning) | - 個別ユーザにパーソナライズされたモデル - 素早い新タスク適応 |
- 学習の学習 - Meta-Optimizationの理解 |
|
LLM | 自己教師あり学習 | Masked LM | BERT | - 文章分類 - 要約 - 検索エンジン最適化(文書埋め込み) |
- マスク化言語モデルの仕組み - Fine-Tuning手法の学習 |
自己回帰LM | GPT | - テキスト生成 - ChatGPTによる対話・QA - コード生成(Copilot) |
- 自己回帰モデルの理解 - デコーダ構造(Transformer)の学習 |
||
自己教師あり学習 + 転移学習 | Encoder-Decoder | T5 / Flan-T5 | - 翻訳・要約・QAなど多目的NLP - Promptベースのタスク切り替え |
- Encoder-Decoder構造 - Instruction Fine-Tuningの学習 |
|
強化学習 + 自己教師あり | RLHF | ChatGPT (InstructGPT) | - 企業向けチャットボット - 問い合わせ対応 - コンサル型対話エージェント |
- 人間フィードバックを取り入れた強化学習 - 安全性・倫理性の学習 |
|
マルチタスク学習 | 大規模モデル | BLOOM / LLaMA / Falcon | - オープンソースLLMの微調整 - 多言語対応(グローバルサービス) |
- 大規模事前学習の活用 - マルチタスク学習の実践 |
さいごに
機械学習(ML)、深層学習(DL)、そして大規模言語モデル(LLM)の手法は日々進化しており、新しいモデルやアルゴリズムが次々と登場しています。本記事では、主要なアルゴリズムやそのビジネス活用例、学習ポイントを一覧表としてまとめました!
これからAIの分野を深めていくうえで、ここで挙げた手法を試しながら実装経験を重ねることで、理論への理解も格段に深まるはずです。また、実務での導入を検討されている方にとっては、自社の課題をどの学習手法で解決できるかを検討する際のヒントになれば幸いです!