AIの「推論」とは何か？学習との違いと注目される理由【コード付きで解説】

Posted at 2025-05-30

🔰 はじめに
機械学習の世界では「モデルを作る」＝学習（Training）が注目されがちですが、実務では 「モデルを使う」＝推論（Inference） がとても重要です。

この記事では、
推論の定義と役割
なぜ今注目されているのか
学習との違い
Pythonでの推論処理のコード例（API化まで）

を紹介します。初心者でもわかりやすく、手を動かせる内容になっています。

推論とは何か？学習との違い

📌 学習（Training）とは
・大量のデータを使って、AIモデルの“頭脳”を育てる工程
・精度の高いモデルを作るのが目的

📌 推論（Inference）とは
・学習済みモデルを使って、新しいデータに「答え」を出す工程
・実際のサービス・アプリに使われる部分

推論が注目されている理由

・生成AIもすべて推論で動いている（ChatGPTは1トークンごとに推論）
・ユーザー体験を左右する処理（回答の速さ＝推論速度）
・推論の高速化・軽量化技術が進化（ONNX, TensorRT, Edge AI など）

実際にやってみる：学習 → 推論API化まで

✅ Step1: 簡単なモデルを学習（Iris分類）

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
import joblib


# データ読み込み
X, y = load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# モデル学習
model = RandomForestClassifier()
model.fit(X_train, y_train)

# モデル保存（推論用に）
joblib.dump(model, 'iris_model.pkl')

✅ Step2: 推論スクリプト（Python単体）

import joblib
import numpy as np

# 学習済みモデルを読み込み
model = joblib.load('iris_model.pkl')

# 新しいデータで推論（例：Irisの花の特徴量）
sample = np.array([[5.1, 3.5, 1.4, 0.2]])
pred = model.predict(sample)

print("予測ラベル:", pred[0])

✅ Step3: Flaskで簡易API化（推論エンドポイント）

from flask import Flask, request, jsonify

app = Flask(__name__)
model = joblib.load('iris_model.pkl')

@app.route('/predict', methods=['POST'])
def predict():
    data = request.get_json()
    features = np.array(data['features']).reshape(1, -1)
    pred = model.predict(features)
    return jsonify({'prediction': int(pred[0])})

if __name__ == '__main__':
    app.run(debug=True)

🔄 テスト用JSON（curlやPostmanで）

{
  "features": [5.1, 3.5, 1.4, 0.2]
}

これで「学習済みモデルを読み込んで、入力を受け取って推論→結果返す」APIが完成です。

推論を使うときの技術Tips

モデルサイズを圧縮したいときは → sklearn → ONNX 変換

推論スピードを上げたいときは → TensorRTやONNX Runtimeを検討

デバイスで動かしたいときは → Edge AI（Jetson, Coralなど）や軽量モデル（MobileNetなど）

まとめ

AIの本質は「学習」よりも「推論」が活きる現場にあります。
特に生成AI時代の今、どれだけ 効率よく推論 できるか＝どれだけAIが実用的かに直結します。

これからAIを使う・作る人にとって、 「推論を理解し、使いこなせる」 ことは欠かせないスキルになります。ぜひ実装から学んでみてください。

お知らせ

一般財団法人高度人材育成機構ではエンジニア向けのリスキリング教材として10時間で学べる生成AI講座を2025/5/30に開講いたしました。
RAGという技術を学んでいただき、社内専用チャットボットを作成できるようになります。また、作成までの過程で生成AIの基礎や数学（確率、行列など）生成AIの原理原則を基礎から学べるeラーニング講座となっております。
個人・法人問わず、ご興味ある方はぜひお問いあわせください。
https://tokyoix.com/ai/

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up