LoginSignup
1
2

More than 1 year has passed since last update.

競馬データEDA その1

Posted at

過去2年の中央競馬の6823レースを分析したものになります。
前提として、今回は複勝馬券内(3位以内)に入れば勝ち、それ以外を負けという扱いにし、分析します。
また、筆者のデータ分析の経験はタイタニックくらいですので参考にしてはいけません。

まず、勝ちと負けの馬の割合です。
スクリーンショット 2022-12-20 13.27.23.png

性別による勝ち負けの差

male,female,gelding(センバ)の勝率の違いを見ています。

スクリーンショット 2022-12-20 13.29.21.png
maleの勝率が5%前後高いことがわかります。また、出走数がmaleが一番多く、センバはかなり少ないというのが見えます。
graph (2).png

下のracecourseのラベルの中身[0:'Hanshin', 1:'Tokyo', 2:'Nakayama', 3:'Chukyo', 4:'Niigata', 5:'Kokura', 6:'Kyoto', 7:'Fukushima', 8:'Sapporo', 9:'Hakodate']

8,9,6,4など、センバの勝率が高い馬場と低い馬場がはっきり分かれていることがわかります。また、maleの勝率はどこも2.3前後にいます。一方でmaleは8,9が高く、センバと連動してそうなグラフであると感じました。
また、8:'Sapporo', 9:'Hakodate',6:'Kyoto',4:'Niigata'など、緯度が高いほどmale以外が勝つ確率も上がっているように思えます(fukushimaだけ別ですが)
具体的な数は以下のようになっています。
スクリーンショット 2022-12-20 13.33.18.png

オッズ,人気による勝ち負けの差

スクリーンショット 2022-12-20 13.57.43.png
右がオッズごとの勝率で、左がオッズごとの勝ちと負けの数の合計のグラフになっています。
項目が細かすぎて黒塗りされてますが、オッズが高い(左に偏る)ほど勝率が高いことがわかります。

スクリーンショット 2022-12-20 14.01.09.png
また、一番人気の勝率が60%くらいで順調に右に下がっていることがわかります。人気順にしっかり勝ち負けが出ていることがわかります。
graph (3).png

とりあえずデータを見て人間の馬を見る目はある程度正しくて、そこから競馬場ごとの性別の成績差などの差という付加価値を見つけていくことが必要だなと感じました。

まだまだ見ていきます。

1
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
2