明けましておめでとうございます!
しかし、俺らの年末はまだ終わらねぇ。
ということで、いわゆる「逆タイム番長」が各大学に存在する。
トラックのベストタイムは高校時の記録で、その後爆伸びしてからはトラックを走っていないため、トラックの記録と本当の実力が見合っていない(いい意味で)選手だ。
10,000mトラックタイムベースで予測をしようとしている今回においては、特に補正しなければならない要素である。
機械学習による予測予定の第101回に向けても、結局は考慮するべき事象な気がしているので、今回の分析を次回に生かす!
<前記事>
箱根駅伝データ分析物語 #5-2:ロード力分析(潜在的個人ロード力)
1. はじめに
はじめに、どのような「逆タイム番長」が具体的に存在するのか。やはり駒澤大学の山川拓馬くんが適任!
持ちタイム
10,000mベスト:30:27
(箱根全大学エントリーランナー平均:29:08)
出走結果
2022全日本:4区区間賞
2023箱根:5区4位
2023出雲:3区日本人トップ
2023全日本:8区区間賞
と、こんな感じに大きなギャップがある…。
実際ハーフマラソンの記録は良いので、ハーフマラソンについても加味すれば改善されるのだろうが、ハーフマラソンの記録がない選手も多々存在するので、やはり10,000mの記録寄与度をあげるためにも、補正ロジックは一旦作成する必要がある。
2. 補正ロジック
以下のようなステップで補正ロジックを作成した。とても複雑なので、セルフチェックの意味も込めて記載する。
STEP①:各駅伝結果からのトラックタイム逆算
- 2020年以降の出雲・全日本・箱根の同区間出走ランナーを対象として、出走ランナーにおける5,000m(出雲)、10,000m(全日本・箱根)タイムの平均値を算出する
- 同様に2020年以降を対象として、同区間における各ランナーの区間タイム標準偏差・偏差値を算出する
- #2で算出した区間タイム標準偏差・偏差値は、トラックタイムでも同様の標準偏差・偏差値だと仮定して、#1で算出した平均値をもとに偏差値ベースでのトラックタイムの逆算値を算出する
ポイント①:5000m⇔10000mのタイム変換
今回、最終的な予測では10,000mトラックタイムを用いているが、出雲駅伝からは5,000mの逆算値算出を行っている。ではどのように10,000mに変換するか…。
世界陸連がワールドランキングというものを公表しているが、そのランキングは各種目におけるスコアに基づいている。そのスコアは各種目の記録に対して付与されるものになる。
そのスコア変換テーブルを参照して、5000mと10000mのトラックタイムの紐づけを行った。
例えば5000m 13:47:84 / 10000m 29:00:51に対しては、どちらも1041ptが付与される。よってこのタイムは同等とみなす、というようなロジック。
STEP②:各逆算値の集約
STEP①で算出した出雲・全日本・箱根の区間タイムから逆算したトラックタイムを、以下のパターンに応じて集約する。
-
過去出走大会が計2大会以上あり、箱根駅伝にも出場している場合:
シンプルに平均
-
過去出走大会が計2大会以上あるが、箱根駅伝に出場していない場合:
出雲・全日本のみでまず平均値を算出、その後箱根は100%と仮定して、2データで平均をとる
-
過去出走大会が1大会の場合:
逆算タイムと現持ちタイムの平均をとる
-
過去出走していない場合:
空欄
STEP③:現持ちタイムとの比較・補正
最後に、現持ちタイムとの比較を実施する。目的は、逆タイム番長のトラックタイムの補正であることを忘れない。
以下のパターンに分けて比較を行い、最終的なトラックタイムを決定した。
①トラック持ちタイムが28:30以下の場合:
トラック持ちタイムそのまま
②以下、トラック持ちタイムが29:30以上で過去2回以上出走している場合
- 逆算値タイムが28:30以下の場合:28:30
- 逆算値タイムが28:30以上でトラック持ちタイム以下の場合:逆算値タイム
- 逆算値タイムがトラック持ちタイム以上の場合:トラック持ちタイム
③上記以外で過去1回以上出走している場合
- 逆算値タイムが28:30以下の場合:28:30
- 逆算値タイムが28:30以上トラック持ちタイム以下の場合:逆算値タイムとトラック持ちタイムの平均
- 逆算値タイムが28:30以上でトラック持ちタイム以上の場合:逆算値タイム
④トラック持ちタイム29:30以下で過去出走していない場合
トラック持ちタイムそのまま
⑤トラック持ちタイム29:30以上で過去出走していない場合
各大学エントリーランナータイムの平均
ポイント②:様々なパターンを考えようとしすぎるあまり複雑怪奇に…
過去出走大会が1回なのにその結果を反映させるのは…等、場合分けパターンを色々考えすぎてしまった結果、複雑怪奇になってしまった。
来年度はこの場合分けも不要だろう…。
3. 補正結果
これによってどのような補正結果になったか、駒澤大で逆タイム番長だと思われる3人を例に以下に示す。
名前 | 補正前タイム | 補正後タイム |
---|---|---|
山川拓馬 | 30:27 | 28:26 |
赤星雄斗 | 30:07 | 28:34 |
庭瀬俊輝 | 30:27 | 28:54 |
結構、妥当なのではないでしょうか……。
4. 限界
やはり、この補正をしたうえで近似を行う必要がある。 これに尽きる。
5. 次分析
次はいよいよ予測結果を載せる……。長かった…。何とか箱根駅伝に間に合わせようと殴り書きになったが、間に合いそうでよかった。。。