netkeiba.com のデータをTSV出力するChrome拡張を作りました。
https://github.com/currysita/netkeiba_feature_assist_extension
netkeiba.comのデータをExcelに貼り付けたかったのですが、うまくできないので勉強ついでにやってみました。
あんまり予想には役立たなかったです。
一応、中央競馬も地方競馬も動くのを確認しています。
使い方
- git cloneしてディレクトリごとChrome拡張にしちゃえば使えます。
- netkeiba.com にログインして、F12を押して開発ツールを開いてください。
- 馬柱のページを開けば出力してくれます。
有料会員じゃないとタイム指数が取れないので、多分正常に動かないです。
特徴
標準化
タイム指数、オッズなど主な素養を標準化してあります。標準化の方法としては最低値を1、最大値を2としています。
-1から1という基本的な標準化をしようとも思ったのですが、素養に重みをもたせた時にマイナスに加速する馬??とかできちゃうので却下しました。
0から1というのも、データに重みをもたせた時に0だと差が大きくなりすぎるので却下しました。
タイム
試しに秒速を出してみました。ぶっちゃけ全然当たる確率に貢献しないです。やっぱりコースの特徴とかと比べないと意味がないですね。
上がり3ハロン
前走のみ取得しています。これも、今のレースに近いものを使わないといけないのでしょうね。
馬体重増減
馬体重の増減に関しては、過去10年程度のJRAのレース結果から、馬齢と増減で絞り込んで勝率を大まかに割り出して定数化しました。2歳の馬だけ独立した値になっていますが、2歳の馬は他の年齢の馬と一緒に走る事が無いためです。
今後の課題
- 騎手の情報を取っていません。取るのが大変そうなので今は諦めてます。
- コース毎の差を考慮した値を出力したいですが、過去のレースのデータが必要なので、ちょっと無理かもしれません。