#前置き
衝撃のサンプルとはGoogle公式の以下です。
財務時系列データを使用した機械学習
TensorFlow1.3でN225の予測を試みます。
まだ機械学習に到達できまてん。
#証券取引所の取引時間を考慮
CSVを読み込みそのままだと同じ日付で処理してしまいますが、実際には日本の市場がおわってからアメリカの市場などがはじまります。
このため予測に使用できるデータは各インデックスでずらす必要があります。
公式のサンプルではあまり説明がありませんが、S&P500の予測を"アメリカ市場が始まる前に"実行しているという意味になっています。
日本の場合は日付変更線に近く早く市場がはじまるので日付はすべて前日のものしか使用できません。
対数差分を取得した後にN225以外のものを1日ずらします。
for index in INDEIES:
closing[index] = closing[index] / max(closing[index])
closing[index] = np.log(closing[index] / closing[index].shift())
if index is not "N225" : # これと
closing[index] = closing[index].shift() # これ追加
また前回は相関を散布図行列で確認しましたが、数値でみてみます。
print(closing.corr()["N225"])
N225 | 1.000000 |
---|---|
HSI | 0.027631 |
GDAXI | 0.372748 |
DJI | 0.485095 |
GSPC | 0.488717 |
SSEC | -0.032805 |
BVSP | 0.320686 |
自己相関同様1が似ていて-1が真逆に似ているということですね。
HSIとSSECは関係なさそう。
2日ずらしてみると以下になります。
N225 | 1.000000 |
---|---|
HSI | 0.014626 |
GDAXI | -0.011343 |
DJI | -0.040324 |
GSPC | -0.041072 |
SSEC | 0.004826 |
BVSP | -0.015128 |
まったく意味をなさなくなりました。関係ないってことですかね。
#相関ってやっぱ偉い投資家の人は見てるの?
少し話がそれます。
なんとなく株などを行われている方はいろいろな相関関係を把握し取引しているんだろうなと思っていましたが、
これでプログラムで相関の高い銘柄をさがせるようになりました。
当然どっかにまとまった情報あるだろうと思って検索してみると以下が出てきました。
Oanda Currensee
うん 今見てみるとしっかり内容が把握できます。
また日本の株価同士の相関もまとめられていたりしましたが、それでは予測ができないです。
しかしリスク分散の為相関の高い銘柄を集中して買わないという判断には使用できそうです。
できればねこそぎデータをいれて相関をだしていき精度の高い学習をさせたいのですが、チョー貧乏なのと機械学習の習得がメインなのでこのまますすめます。
次回より機械学習にやっとはいれるので短いのですがここで切ります。
前 TensorFlowを投資につかうまで 衝撃のサンプル編 (2)
次 TensorFlowを投資につかうまで 衝撃のサンプル編 (4)