やったこと
scikit-learnのアルゴリズム選択マップの中の一つであるSGD Regressor
を実装すると同時に、どれくらい複雑なデータに対応できるのかを検証してみた。
n次関数の予測(n: 1~10)
データ数が100,1000,1000000ごとにSGD Regressorの精度を調べてみた
結果
4次関数から、大きな誤差が目視できるようになったが、9次関数でも大きな特徴は捉えていた(山と谷の位置は一致していた)
ただし、これはn次関数のnの値が大きくなればなるほど、Yの値は大きくなるので、元データに対する誤差の割合は一定なのかもしれない。(後日検証します)
赤色が予測結果で、青色が正解データです。