はじめに
競馬、楽しいですよね。完全に私の週末の趣味なのですが、実際にレースを見ている時より、レースに向けて過去のデータや馬柱をあれこれ眺めながら、予想している時間が一番楽しかったりします。
ふと、思いました
「これ、NotebookLMにデータぶち込んで予想させたらどうなる?」
気になったら試さずにはいられないタマなので、GoogleのNotebookLMを使って、手軽にデータ予想してみることにしました。
データを集めて実際に日本ダービーの予想を行うまでに行った内容を、自分の備忘録を兼ねて全4回に分けてアウトプットしてみます。
初回の本記事は集めるデータの検討までを記載します。
なぜNotebookLM?
NotebookLMはGeminiのように「ネット上の膨大な知識」から回答するのではなく、 「自分が提供した資料(ソース)」だけを徹底的に分析して対話する という特徴があります。
なので、今回のようにデータ分析をするのに最適だと考えました。
なによりも 「無料で使える」 のがいいですね。
無料で使える範囲に制限はありますが、今回のように手軽に試すぐらいであれば十分です。
いい時代です。
集めるデータの検討
私が普段予想をする時に見るデータを集めればいいかなとは思いつつ、Geminiに聞いてみました。
NotebookLMを使用して、競馬の予想をしたいです
予想に必要な情報を教えてください
Geminiの回答
NotebookLMを活用して競馬予想の環境を構築するのですね!非常に面白く、NotebookLMの強みを活かせる使い方だと思います。NotebookLMは「投げ込んだデータ(ソース)をもとに、高度な分析や要約を行うAI」です。そのため、AIが自動で最新のパドック情報やオッズをネットから拾ってくるわけではありません。「いかに質の良い、網羅された情報をソースとして覚え込ませるか」が予想の精度を大きく左右します。
競馬予想を本格的に行うために、NotebookLMに学習させるべき「必要な情報(ソース)」を4つのカテゴリに分けて紹介します。
1. レース・コースに関する情報(舞台設定)
レースが行われる環境のデータです。過去の傾向を分析させるために重要になります。
-
コース特性・馬場状態:
-
開催トラック(芝・ダート、右回り・左回り、直線・小回り)
-
コースの起伏(坂の位置や高低差)
-
当日の馬場状態(良、稍重、重、不良)や、事前の天気予報・含水率
-
過去の同レースデータ(過去10年分など):
-
脚質傾向(逃げ・先行が有利か、差し・追込が決まりやすいか)
-
枠順の有利不利(内枠有利、外枠不利など)
-
人気の傾向(大荒れしやすいか、堅く決まりやすいか)
2. 出走馬に関する情報(主役のデータ)
各馬の能力や適性をNotebookLMに比較させるためのコアデータです。
-
出馬表(馬柱):
-
馬名、性齢、斤量(負担重量)、枠順、騎手名、調教師名
-
過去のレース成績(前走〜前々走など):
-
走破タイム、上がり3ハロンの時計
-
着順と着差(どれくらい惜しいレースだったか)
-
通過順位(どういう展開のレースをしたか)
-
適性・血統データ:
-
距離適性(1600m専門、2000mもこなせる等)
-
重馬場適性(雨の日に強い血統か)
-
血統背景(父、母の父などの実績)
3. 当日の状態・ポテンシャルに関する情報(直近の評価)
現在の調子や、人間側の思惑を反映させるためのデータです。
-
調教(追い切り)情報:
-
調教タイム、動きの評価(「動き軽快」「併せ馬で先着」などのテキスト情報)
-
陣営のコメント・記者予想:
-
スポーツ紙や競馬サイトに掲載される、調教師や騎手の生の声(「今回は状態が良い」「距離延長が鍵」など)
-
専門記者の見解や印(◎◯▲△)の理由が書かれたコラム
4. 人間(騎手・調教師)に関する情報
競馬は生き物と人間が一体となるスポーツなので、人のデータも強力な指標になります。
- 騎手・調教師のデータ:
- リーディング順位(勝率・連対率)
- その競馬場・コースとの相性
- 「乗り替わり(前走と違う騎手)」の情報
💡 NotebookLMを活かす「データの集め方・使い方」のコツ
競馬新聞やネットの競馬メディア(netkeibaなど)のテキスト、PDF、またはJRA公式のデータページをコピー&ペーストしてNotebookLMの「ソース」に追加していくだけで、あなただけの「競馬予想AIアシスタント」が完成します。
データが入ったら、以下のように質問(プロンプト)してみてください。
- 「今回の出走馬の中で、過去に同じコース(または類似コース)で好成績を残している馬を3頭ピックアップして、その理由も教えて」
- 「前走の上がり3ハロンのタイムが最も速く、かつ今回の斤量が軽くなっている馬はどれ?」
- 「調教コメントや陣営の発言から、最も勝負気配が高い(自信がありそうな)馬を分析して」
まずは今週末の気になるレースの出馬表と、過去数年の結果のテキストをソースに放り込んで、試してみてはいかがでしょうか?
返ってきた回答の情報を全て集めるのは少し量が多いので、私が普段見ている情報でもあることから
今回は以下3つを集めることにしました。
- 過去のレース結果(20年分)
- 過去のレース出走馬の競争成績(20年分)
- 今年の出走馬情報とその競争成績
次回
集めるデータが決まったので、実際にデータを集める際に行なった内容を記載します。