はじめに
競馬予想AIを作る記事の続きです。(前回)
現状の自作AIでは、人気の影響を強く受けるため、1番〜5番人気をよく選んでしまう。
その結果、荒れたレースは全損、勝ててもリターンが少なかったり赤字となってしまうため、短期的な勝ちを目指すなら穴馬の特定が必須である。
今回の目的は「短期的に勝つために穴馬を探す方法を検討する」ことである。
そのためには荒れたレースで勝つ必要がある。
荒れたレースでは人気の低い馬が3着以内に入っているため、タイトルに書いている通説を検証する。
この通説の根拠としては、以下のようなものがよく挙げられている。
- たまたま相手がバケモンだったので負けただけで、そのグレード内では十分強い
- たまたま苦手な馬場や距離だったので負けたが、得意な状況では十分強い
これらは納得できる根拠ではあるものの、データとして示されることは少ない。
そこで今回はデータから検証することにした。
分析方法
中央競馬のレースデータから、今走人気と前走人気を取得し、各馬が3着以内に入ったかどうかを集計し、勝率を求める。
ここでの勝率とは、その人気遷移の馬が3着以内に入る確率とする。
また、確率の求め方は、その人気遷移で勝った回数 / その人気遷移だった馬の総数
とする。
分析に使用するデータは2022年の中央レースのうち約1200件である。
(過去走の人気を取得していなかったので集め直している最中。最終的に約5万レース分になる予定)
分析結果
実際に集計してヒートマップにしたものが下図である。
色が明るいほど勝率が高いことを表している。
前走人気が高く、今走人気が低く、勝率が高い場所を探すと、左上あたりが目に付く。
前走人気が7番以上で、今走人気が12番以下の領域が少し明るい。
特に前走が3番人気のとき、最も穴馬率が高い傾向にあることが分かった。
この結果から、通説「人気急落場は穴馬」が概ね正しいと確認できた。
実際のレースはどうか
2024年の有馬記念の結果を見ると、以下のようになっていた。
着順 | 馬名 | 今走人気 | 前走人気 |
---|---|---|---|
1 | レガレイラ | 4 | 1 |
2 | シャフリヤール | 10 | 3 |
3 | ダノンデサイル | 2 | 1 |
前述した通り、10番人気で2着のシャフリヤールが穴馬となっていることが確認できる。
加えて、シャフリヤールは前走人気が3番であり、今回の結果とそこそこ合致する。
この通説を知っているかどうかで稼ぎが大きく変わる事例と言える。
まとめ
今回は「人気急落馬は穴馬」説を検証した。
人気遷移を基に集計を行い、3着以上に入る確率(勝率)を求めた結果、前走人気が6番以上なら勝率が比較的高いことが分かった。
実際に2024年の有馬記念では、前走人気3番、今走人気10番のシャフリヤールが2着に入っていることが確認できる。
以上のことから、この通説は概ね正しいことが確認できた。
今後は更にデータを増やして再集計した結果で検証し直す予定である。
また、その結果を用いて各馬の勝率予測することを検討している。