※前回を踏まえて今回は回帰を行います。
#目的
過去4日分を参考に日経平均を予測します。
#株価データの読み込み
松井証券のcsvから終値を読み込みます。ここは同じです。
#coding: UTF-8
import pandas as pd
stock_data = pd.read_csv('stockchart_20180909.csv')
owarine = stock_data[['終値']]
分類編では前日との差/100を結果としましたが、今回は当日の日経平均を結果とします。
successive_data = []
answers = []
for i in range(4, count_s):
successive_data.append([owarine[i-4], owarine[i-3], owarine[i-2], owarine[i-1]])
answers.append(owarine[i] )
学習します。
reg = LinearRegression().fit(successive_data, answers)
前回と同じく同じデータでテストします。
predicted = reg.predict(successive_data)
#まとめ
結果を表示します。
計算値と実際値の誤差をグラフにしました。
5%以上の誤差が出たのは7件でした。
ソース