More than 5 years have passed since last update.

線形回帰・最小二乗法について、と、その具体例

Last updated at 2019-11-02Posted at 2019-10-31

この記事では、機械学習に用いるモデルの中でも基本的な線形回帰について説明します。機械学習についてはこの記事で説明しているのでこちらも参考にして下さい。
https://qiita.com/aogyt/items/fc1afcf5eabcc016f508

教師あり学習アルゴリズムの仕組み

本題の線形回帰に入る前に、教師あり学習アルゴリズムに関して説明しようと思います。

教師あり学習には必ず訓練セットが必要です。例えば、

このようなデータがあるとします。このデータは学習アルゴリズムに読み込まれ、そのアルゴリズムはある関数を出力します。この関数はよく「h」と表現され、仮説関数（あるいは説明関数とも）といいます。そして、それを評価するのが目的関数です。この仮説関数と目的関数は非常に重要な概念です。といっても抽象的な概念だけでは分かりにくいので後半では具体例を見ていきます。

線形回帰・最小二乗法とは

今回使うモデルは線形回帰です。線形回帰とは、多数のデータの特徴を線形的に（つまり直線によって）表し、未知のデータを与えられたときに推測するためのモデルのことを言います。線形回帰の中の具体的な方法の１つに最小二乗法というものがあります。

まずここにデータがあります。

そして、最終目標は

このように、データの特徴を最もよく表した直線の式を求めることです。その為には、どういう直線が「特徴を最もよく表しているのか」を評価する基準のようなものが必要です。それを今から説明します。
まず、ある１つのデータ（点）に注目します。写真でいうと緑色の点です。

この点の座標を(x,y)とします。この時、赤色の直線は「xのときのｙの値はh(x)くらいじゃないかな？」と予想しています。実際の値はyなので、誤差が h(x)-y だけあることになります。

つまりこの誤差がすべての点で小さくなるように直線をとれば、それは「特徴を最もよく表している」と言えるでしょう。ということで、この誤差の総和をとって、、、と
したいところですが、ここで問題が１つ発生します。この直線の予想よりも大きいときと小さいときの誤差をそのまま足してしまうと正しい誤差を見ることが出来なくなってしまいます。もともと誤差が小さいのか、+と-で打ち消されて小さくなったのか区別がつかないからです。そこで、誤差の２乗の和で評価しようというのが、最小二乗法です。「二乗」を「最小」にする方法ということですね。