競馬情報の機械学習の展開方法について
機械学習初心者ですが、勉強も兼ねて競馬の予測をしています。
以下のようなデータがあるときにどのような機械学習をしていけばいいのか迷っています。
回収率をあげるためにどのような方法やデータを使っていくべきなのか、また、機械学習について勉強のためのアドバイスをいただけると幸いです。
現状行ったこと:
・各週のデータのみを用いて機械学習PyCaretを使って機械学習させる(favorite(人気順推測器になるため、回収率が悪い))
・各競走馬ごとの過去レース情報を用いて、各競走馬の次回レースの平均時速を予測させ、それを強さ指標として用いる(精度が❌)
・各競走馬ごとの過去レース情報
・競走馬の基本情報
・決闘情報
・各週のデータ(項目名が英語になってます)40000件ほどデータがあります
race_id order_of_finish(着順) bracket_number horse_number horse_name gender age penalty jockey odds favorite horse_weight weigh_cycling racecourse circumference turn wether track_surface track_condition
0 202110010101 1 4 5 Kitano Indy male 3 55 Yutaro Mori 7.1 4 458 4 Kokura 1700 clockwise cloudy dirt good
...
0 likes