More than 5 years have passed since last update.

機械学習（回帰モデル）で使用する評価指標を整理してみた

Last updated at 2020-12-19Posted at 2020-11-08

製造業出身のデータサイエンティストがお送りする記事
今回は回帰モデルで使用する評価指標を整理してみました。

はじめに

今回は、機械学習の評価指標（回帰モデル）を整理してみました。
また、各評価指標を使用する際のポイントについても纏めてみました。

1. 決定係数

決定係数$R^2$では、推定された回帰モデルの当てはまりの良さを評価します。
数式は下記の通りです。

\begin{eqnarray}
R^2 = 1 - \sum \frac{(y_i - \hat{y_i})^2}{(y_i - \bar{y})^2}
\end{eqnarray}

$y_i$ : $i$番目サンプルの実測値
$\hat{y_i}$ : $i$番目サンプルの予測値
$\bar{y}$ : 実測値の平均

項目	概要
判断基準	・1に近いほど良い値
解釈	・回帰モデルの当てはまりの良さを評価
特徴	・説明変数が多くなると1に近づいていく・非線形モデルを評価することはできない

pythonのコードは下記の通りです。

# スコア計算のためのライブラリ
from sklearn.metrics import r2_score

# trueが真の値（実測値）、predが予測値
true = [1.0, 1.5, 2.0, 1.2, 1.8]
pred = [0.8, 1.5, 1.8, 1.3, 2.0]

# 決定係数R2の値を算出
r2_score(true, pred)

2. MAE

MAE(Mean Absolute Error)では、予測値の誤差の大きさを評価します。
数式は下記の通りです。

\begin{eqnarray}
MAE = \frac{1}{N} \sum|y_i - \hat{y_i}|
\end{eqnarray}

$y_i$ : $i$番目サンプルの実測値
$\hat{y_i}$ : $i$番目サンプルの予測値
$N$ : サンプル数

項目	概要
判断基準	・0に近いほど良い値
解釈	・予測値と実測値の平均的なズレ（誤差）の大きさ
特徴	・大きく予測を外したケースをあまり重要視していない・MAEを基準として良いモデルを選ぶと最大誤差が大きくなる傾向にある

pythonのコードは下記の通りです。

# スコア計算のためのライブラリ
from sklearn.metrics import mean_absolute_error

# trueが真の値（実測値）、predが予測値
true = [1.0, 1.5, 2.0, 1.2, 1.8]
pred = [0.8, 1.5, 1.8, 1.3, 2.0]

# MAEの値を算出
mean_absolute_error(true, pred)

3. MSE

MSE(Mean Squared Error)では、大きな誤差を重要視して評価します。
数式は下記の通りです。

\begin{eqnarray}
MSE = \frac{1}{N} \sum(y_i - \hat{y_i})^2
\end{eqnarray}

$y_i$ : $i$番目サンプルの実測値
$\hat{y_i}$ : $i$番目サンプルの予測値
$N$ : サンプル数

項目	概要
判断基準	・0に近いほど良い値
解釈	・予測値と実測値のズレの大きさと解釈できる・MAEと類似しているが、MAEのように実際の平均的な誤差とは異なる
特徴	・大きく予測を外したケースを重要視している・予測を大きく外すと大幅にMSEが大きくなる傾向にある

pythonのコードは下記の通りです。

# スコア計算のためのライブラリ
from sklearn.metrics import mean_squared_error

# trueが真の値（実測値）、predが予測値
true = [1.0, 1.5, 2.0, 1.2, 1.8]
pred = [0.8, 1.5, 1.8, 1.3, 2.0]

# MSEの値を算出
mean_squared_error(true, pred)

4. RMSE

RMSE(Root Mean Squared Error)では、大きな誤差を重要視して評価します。
数式は下記の通りです。

\begin{eqnarray}
RMSE = \sqrt{\frac{1}{N} \sum(y_i - \hat{y_i})^2}
\end{eqnarray}

$y_i$ : $i$番目サンプルの実測値
$\hat{y_i}$ : $i$番目サンプルの予測値
$N$ : サンプル数

項目	概要
判断基準	・0に近いほど良い値
解釈	・予測値と実測値のズレの大きさと解釈できる・MAEと類似しているが、MAEのように実際の平均的な誤差とは異なる
特徴	・大きく予測を外したケースを重要視している・予測を大きく外すと大幅にRMSEが大きくなる傾向にある

pythonのコードは下記の通りです。

# スコア計算のためのライブラリ
import numpy as np
from sklearn.metrics import mean_squared_error

# trueが真の値（実測値）、predが予測値
true = [1.0, 1.5, 2.0, 1.2, 1.8]
pred = [0.8, 1.5, 1.8, 1.3, 2.0]

# RMSEの値を算出
np.sqrt(mean_squared_error(true, pred))

5. MAPE

MAPE(Mean Absolute Percentage Error)では、実測値の大きさあたりの予測誤差の大きさを評価します。
数式は下記の通りです。

\begin{eqnarray}
MAPE = \frac{1}{N} \sum|\frac{y_i - \hat{y_i}}{y_i}|
\end{eqnarray}

$y_i$ : $i$番目サンプルの実測値
$\hat{y_i}$ : $i$番目サンプルの予測値
$N$ : サンプル数

項目	概要
判断基準	・0に近いほど良い値
解釈	・実測値の大きさに対する予測値の平均的なズレ（誤差）の割合
特徴	・実測値に対する予測誤差の割合の大きさを重要視している・実測値が0を取るケースでは使用できない

pythonのコードは下記の通りです。

# スコア計算のためのライブラリ
import numpy as np

# trueが真の値（実測値）、predが予測値
true = np.array([1.0, 1.5, 2.0, 1.2, 1.8])
pred = np.array([0.8, 1.5, 1.8, 1.3, 2.0])

# MAPEの値を算出
np.mean(np.abs((true - pred) / true)) * 100

6. SMAPE

SMAPE(Symmetric Mean Absolute Percentage Error)では、実測値の大きさあたりの予測誤差の大きさを評価します。
数式は下記の通りです。

\begin{eqnarray}
SMAPE = \frac{100}{N} \sum|\frac{2(y_i - \hat{y_i})}{(|y_i|+|\hat{y_i}|)}|
\end{eqnarray}

$y_i$ : $i$番目サンプルの実測値
$\hat{y_i}$ : $i$番目サンプルの予測値
$N$ : サンプル数

項目	概要
判断基準	・0に近いほど良い値
解釈	・実測値の大きさに対する予測値の平均的なズレ（誤差）の割合
特徴	・実測値に対する予測誤差の割合の大きさを重要視している・MAPEと異なり、実測値が0を取るケースでも使用できる

pythonのコードは下記の通りです。

# スコア計算のためのライブラリ
import numpy as np

# trueが真の値（実測値）、predが予測値
true = np.array([1.0, 1.5, 2.0, 1.2, 1.8])
pred = np.array([0.8, 1.5, 1.8, 1.3, 2.0])

# SMAPEの値を算出
100/len(true) * np.sum(2 * np.abs(pred - true) / (np.abs(pred) + np.abs(true)))

スクリプトの纏め

今までのスクリプトを整理します。

# スコア計算のためのライブラリ
import numpy as np
import pandas as pd
from sklearn.metrics import r2_score
from sklearn.metrics import mean_absolute_error
from sklearn.metrics import mean_squared_error

def mape(true, pred):  
    """MAPEを計算する

    Parameters
    ----------
    true (np.array) : 実測値
    pred (np.array) : 予測値

    Returns
    -------
    np.array        : mapeの計算結果

    """
    return np.mean(np.abs((true - pred) / true)) * 100

# SMAPEの計算
def smape(true, pred):
    """SMAPEを計算する

    Parameters
    ----------
    true (np.array) : 実測値
    pred (np.array) : 予測値

    Returns
    -------
    np.array        : smapeの計算結果

    """
    return 100/len(true) * np.sum(2 * np.abs(pred - true) / (np.abs(pred) + np.abs(true)))

def calculate_scores(true, pred):
    """全ての評価指標を計算する

    Parameters
    ----------
    true (np.array)       : 実測値
    pred (np.array)       : 予測値

    Returns
    -------
    scores (pd.DataFrame) : 各評価指標を纏めた結果

    """
    scores = pd.DataFrame({'R2': r2_score(true, pred),
                          'MAE': mean_absolute_error(true, pred),
                          'MSE': mean_squared_error(true, pred),
                          'RMSE': np.sqrt(mean_squared_error(true, pred)),
                          'MAPE': mape(true, pred),
                          'SMAPE': smape(true, pred)},
                          index = ['scores'])
    return scores

def main():

    true = np.array([1.0, 1.5, 2.0, 1.2, 1.8])
    pred = np.array([0.8, 1.5, 1.8, 1.3, 2.0])

    scores = calculate_scores(true, pred)

    print(scores)

if __name__ == "__main__":
    main()

	R2	MAE	MSE	RMSE	MAPE	SMAPE
scores	0.808824	0.14	0.026	0.161245	9.888889	10.254971

さいごに

最後まで読んで頂き、ありがとうございました。
訂正要望がありましたら、ご連絡頂けますと幸いです。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up