過去2年の中央競馬の6823レースを分析したものになります。
前提として、今回は複勝馬券内(3位以内)に入れば勝ち、それ以外を負けという扱いにし、分析します。
また、筆者のデータ分析の経験はタイタニックくらいですので参考にしてはいけません。
性別による勝ち負けの差
male,female,gelding(センバ)の勝率の違いを見ています。
maleの勝率が5%前後高いことがわかります。また、出走数がmaleが一番多く、センバはかなり少ないというのが見えます。
下のracecourseのラベルの中身[0:'Hanshin', 1:'Tokyo', 2:'Nakayama', 3:'Chukyo', 4:'Niigata', 5:'Kokura', 6:'Kyoto', 7:'Fukushima', 8:'Sapporo', 9:'Hakodate']
8,9,6,4など、センバの勝率が高い馬場と低い馬場がはっきり分かれていることがわかります。また、maleの勝率はどこも2.3前後にいます。一方でmaleは8,9が高く、センバと連動してそうなグラフであると感じました。
また、8:'Sapporo', 9:'Hakodate',6:'Kyoto',4:'Niigata'など、緯度が高いほどmale以外が勝つ確率も上がっているように思えます(fukushimaだけ別ですが)
具体的な数は以下のようになっています。
オッズ,人気による勝ち負けの差
右がオッズごとの勝率で、左がオッズごとの勝ちと負けの数の合計のグラフになっています。
項目が細かすぎて黒塗りされてますが、オッズが高い(左に偏る)ほど勝率が高いことがわかります。
また、一番人気の勝率が60%くらいで順調に右に下がっていることがわかります。人気順にしっかり勝ち負けが出ていることがわかります。
とりあえずデータを見て人間の馬を見る目はある程度正しくて、そこから競馬場ごとの性別の成績差などの差という付加価値を見つけていくことが必要だなと感じました。
まだまだ見ていきます。