0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【競馬AI検証記録】260517:ヴィクトリアマイル(東京11R)

0
Posted at

自作した競馬予測モデルを今後1年間のGIレースに適用して性能を検証してみようと思います。
本稿は、検証したレースの予測結果と、実際のレース結果を受けてのモデルの挙動に関する所感をまとめておく記録用の記事となります。

予測結果までスキップする▶ヴィクトリアマイル予測結果

予測モデルの概要と検証方法

ベース

今回、モデルを2種類構築しましたが、使用するデータや加工は両モデルで同じです。

  • アルゴリズム:LightGBM
  • モデル①:スピード指数予測モデル
  • モデル②:3着以内予測モデル

使用データ概要

分野 指標
レース情報 会場, レース目, 距離, トラック種別, 重賞, レースクラス, 年齢クラス, 性別クラス, 頭数, 天気, 馬場
出走馬情報 horse_id, 枠番, 馬番, 性別, 年齢, 斤量, 馬体重, 前走比, jockey_id, trainer_id, 累計獲得賞金, 輸送距離, 会場_相性, トラック種別_相性,馬番_相性, 騎手_相性, 馬場_相性, 天気_相性
前走~3走 タイム, Last3F, 着順, スピード指数, 馬場指数, 会場, レース目, 距離, トラック種別, レースクラス, 頭数, 天気, 馬場, 枠番, 馬番, jockey_id, trainer_id

基本的にはnetkeibaの中央競馬のデータをスクレイピングし加工しています。
相性は、過去の同条件のレースでの賞金獲得実績から算出しています。
スピード指数はこちらのサイトの算出方法を参考に、自身で算出プロセスを組みました。
https://team-d.club/speed-index/about-speed-index/
算出には過去3走の実績を使用しているので、中央競馬の出走実績が3走に満たない馬は予測の対象外となります。

スピード指数予測モデル

  • 予測手法:回帰
  • 目的変数:スピード指数
  • 購入対象(フラグ):スピード指数上位5頭

継続的な検証をするには1レースで5頭は多すぎる気もしますが、シミュレーションでは上位3頭よりは網羅できる結果となっていたので、これで行きたいと思います。

3着以内予測モデル

  • 予測手法:分類
  • 目的変数:flg(3着以内だと1)
  • 購入対象(フラグ):予測確率上位3頭

こちらのモデルは、キャリブレーション(sigmoid、isotonic)やオッズに応じた予測確率の補正を施しています。

検証方法

2026年に中央競馬で開催されるGIレースを対象として予測結果に従って単勝馬券を購入します。
ただし、予測対象の頭数が出走頭数の過半数に満たないときは、そのレースの購入を見送ります。
モデル別に毎レースの回収率を算出し、結果を検証します。
最終的に有馬記念までの合算した回収率から実績を評価します。

ヴィクトリアマイル予測結果

馬番 馬名 予測スピード指数 3着以内予測確率 参考単勝オッズ 人気 flg_1 flg_2
1 カピリナ 82.9969 0.216279 86.9 16 -
12 エンブロイダリー 82.8748 0.348947 2 1
13 カナテープ 82.7653 0.204715 34.1 12 -
8 カムニャック 82.7625 0.126934 5.7 2 -
18 チェルヴィニア 82.7533 0.25564 18.8 5 -
6 ラヴァンダ 82.7446 0.266059 21 6 - -
5 ケリフレッドアスク 82.3696 0.271474 95.2 17 - -
7 クイーンズウォーク 82.133 0.11718 8.8 3 - -
17 パラディレーヌ 82.1208 0.259189 33.9 10 - -
10 ドロップオブライト 82.0456 0.168887 71.3 14 - -
2 ワイドラトゥール 81.6649 0.184973 139.7 18 - -
9 ココナッツブラウン 81.4766 0.340681 27.4 9 -
15 アイサンサン 81.2853 0.255836 36.3 13 - -
16 ニシノティアモ 81.2052 0.107465 12.7 4 - -
3 マピュース 81.1428 0.309361 78.2 15 - -
11 ボンドガール 81.0976 0.199014 34.1 11 - -
14 ジョスラン 81.0185 0.433964 22.5 8 -
4 エリカエクスプレス 80.8189 0.277606 21.2 7 - -

「flg_1」はスピード指数予測モデルの予測結果をもとに単勝を購入する対象を「○」とし、
「flg_2」は3着以内予測モデルの予測結果をもとに単勝を購入する対象を「○」としています。

※参考単勝オッズと人気は予測時点のものです。

今回は2頭が両モデルのフラグ対象となっているため、両モデルともに的中できる可能性があります。
1番人気のエンブロイダリーは圧倒的な人気ですので、基本的には堅い結果が予想されます。

レース結果を受けての所感

1着:12番エンブロイダリー(1番人気)単勝オッズ1.9倍
見事、的中することができました。

予測モデル 的中 回収率
予測スピード指数 38.0%
3着以内予測確率 63.3%

当日の仕上がりも申し分なく、納得の結果だったと思います。

現在の成績

検証レース数:7

予測モデル 的中率 回収率
予測スピード指数 57.1% 30.3%
3着以内予測確率 57.1% 45.7%

依然として人気馬の勝つ展開が続いていますので、人気の低い馬が勝利するかつその回を的中させる展開にならなければ、このシミュレーション条件下ではまだまだ厳しい状況です。

これからが楽しみですね。

それではまた、次回の検証で。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?