title: 【文系合格者が整理】G検定「機械学習アルゴリズム」攻略|教師あり・教師なしの違いと代表手法を一気に理解
tags: G検定 AI ディープラーニング JDLA 資格
はじめに
こんにちは。2026年1月のG検定に合格した、文系出身のエンジニアです。
G検定の勉強を始めると、最初の大きな壁になるのが機械学習のアルゴリズムではないでしょうか。「教師あり学習」「教師なし学習」「回帰」「分類」「クラスタリング」……カタカナと専門用語が一気に押し寄せてきて、文系の自分は正直パニックでした。
でも、実は機械学習のアルゴリズムは3つのカテゴリに分けて整理するだけで驚くほどスッキリします。この記事では、G検定で頻出の機械学習アルゴリズムを「文系でもわかる言葉」で整理していきます。
注意: この記事はJDLA公式の教材ではありません。筆者個人の学習経験に基づく内容です。最新のシラバスは JDLA公式サイト でご確認ください。
機械学習の3つのカテゴリ
まず、機械学習は大きく3つに分かれます。これがすべての土台です。
| カテゴリ | 一言で言うと | 正解データ | G検定での出題頻度 |
|---|---|---|---|
| 教師あり学習 | 「答え付きの問題集」で学ぶ | あり | 高 |
| 教師なし学習 | 「答えなし」でデータの構造を見つける | なし | 高 |
| 強化学習 | 「試行錯誤」で最適な行動を学ぶ | なし(報酬あり) | 中 |
私はこの3分類を「勉強のやり方」に例えて覚えました。
- 教師あり学習 = 先生が答えを教えてくれる授業
- 教師なし学習 = 自分でノートを整理して共通点を見つける自習
- 強化学習 = ゲームを繰り返しプレイしてハイスコアを目指す
強化学習については別の記事で詳しく解説しているので、ここでは教師あり学習と教師なし学習に絞ります。
教師あり学習の代表的アルゴリズム
教師あり学習はさらに「回帰(数値を予測する)」と「分類(カテゴリを予測する)」に分かれます。
回帰(数値の予測)
| アルゴリズム | やっていること | 身近な例 |
|---|---|---|
| 線形回帰 | データに一番フィットする直線を引く | 広告費から売上を予測 |
| 重回帰分析 | 複数の要因から数値を予測する | 面積・駅距離・築年数から家賃を予測 |
| リッジ回帰・ラッソ回帰 | 重回帰 + 過学習を防ぐ仕組み(正則化) | 変数が多いときの予測精度改善 |
G検定ポイント: 線形回帰と重回帰の違い(説明変数が1つか複数か)はよく問われます。また、リッジ回帰(L2正則化)とラッソ回帰(L1正則化)の違いも頻出です。
分類(カテゴリの予測)
| アルゴリズム | やっていること | 身近な例 |
|---|---|---|
| ロジスティック回帰 | 確率を計算して2択に分ける | メールがスパムかどうか |
| 決定木 | 「はい/いいえ」の質問を繰り返して分類 | 症状から病名を判定 |
| ランダムフォレスト | たくさんの決定木で「多数決」する | 融資審査の判定 |
| SVM(サポートベクターマシン) | データの間に最も良い境界線を引く | 手書き文字の認識 |
| k-NN(k近傍法) | 近くにいるデータの多数決で分類 | 映画のジャンル推薦 |
G検定ポイント: 「ロジスティック回帰」は名前に「回帰」と付いていますが、実際は分類アルゴリズムです。これは試験でひっかけ問題として出やすいので要注意。
教師なし学習の代表的アルゴリズム
教師なし学習は「クラスタリング(グループ分け)」と「次元削減(情報の圧縮)」が中心です。
クラスタリング
| アルゴリズム | やっていること | 身近な例 |
|---|---|---|
| k-means法 | データをk個のグループに分ける | 顧客をグループ分けしてマーケティング |
| 階層的クラスタリング | 近いデータから順にまとめていく | 生物の系統樹のような分類 |
次元削減
| アルゴリズム | やっていること | 身近な例 |
|---|---|---|
| 主成分分析(PCA) | たくさんの特徴を少数の重要なものに圧縮 | 100項目のアンケートを数個の因子に要約 |
| t-SNE | 高次元データを2Dや3Dに可視化する | 大量のデータの傾向をグラフで確認 |
G検定ポイント: k-means法では最初にクラスタ数kを自分で決める必要があることが問われます。また、主成分分析は「次元削減」の代表として頻出です。
文系が間違えやすいポイント3選
私が実際に模擬試験で間違えたポイントを共有します。
1. ロジスティック回帰は「分類」
前述のとおり、名前に惑わされないようにしましょう。シグモイド関数で0〜1の確率に変換して分類する手法です。
2. SVMの「マージン最大化」
SVMは2つのクラスの間のマージン(余白)を最大化する境界線を引きます。「サポートベクター」とは、境界線に最も近いデータ点のことです。
3. k-meansとk-NNは別物
どちらも「k」が付きますが、k-meansは教師なし学習(クラスタリング)、k-NNは教師あり学習(分類)です。試験では混同を狙った問題が出ます。
試験対策のコツ
最後に、この分野の試験対策のコツをまとめます。
- まず3分類を完璧に: 教師あり・教師なし・強化学習の違いを自分の言葉で説明できるようにする
- 表で整理する: 各アルゴリズムを「カテゴリ × タスク(回帰/分類/クラスタリング)」の表にまとめると頭に入りやすい
- 身近な例を考える: 「このアルゴリズム、日常のどんな場面で使える?」と考えると記憶に定着する
- ひっかけポイントを意識する: ロジスティック回帰、k-meansとk-NNなど、名前が紛らわしいものは重点的に復習する
おすすめの学習リソース
G検定の機械学習分野をもっと深く学びたい方には、以下のリソースがおすすめです。
- AI検定学習ナビ - G検定の分野別対策やキーワード解説がまとまっています
- JDLA公式テキスト(通称「白本」)- 機械学習の章を繰り返し読むのが基本
- 模擬試験アプリ - アルゴリズムの分類問題を何度も解いて定着させましょう
この記事が、G検定の機械学習分野の理解に少しでも役立てば嬉しいです。一緒に頑張りましょう!