LoginSignup
1
1

箱根駅伝データ分析物語 #6:逆タイム番長トラックタイム補正

Posted at

明けましておめでとうございます!
しかし、俺らの年末はまだ終わらねぇ。

ということで、いわゆる「逆タイム番長」が各大学に存在する。
トラックのベストタイムは高校時の記録で、その後爆伸びしてからはトラックを走っていないため、トラックの記録と本当の実力が見合っていない(いい意味で)選手だ。

10,000mトラックタイムベースで予測をしようとしている今回においては、特に補正しなければならない要素である。

機械学習による予測予定の第101回に向けても、結局は考慮するべき事象な気がしているので、今回の分析を次回に生かす!

<前記事>
箱根駅伝データ分析物語 #5-2:ロード力分析(潜在的個人ロード力)

1. はじめに

はじめに、どのような「逆タイム番長」が具体的に存在するのか。やはり駒澤大学の山川拓馬くんが適任!

持ちタイム
10,000mベスト:30:27
(箱根全大学エントリーランナー平均:29:08)

出走結果
2022全日本:4区区間賞
2023箱根:5区4位
2023出雲:3区日本人トップ
2023全日本:8区区間賞

と、こんな感じに大きなギャップがある…。

実際ハーフマラソンの記録は良いので、ハーフマラソンについても加味すれば改善されるのだろうが、ハーフマラソンの記録がない選手も多々存在するので、やはり10,000mの記録寄与度をあげるためにも、補正ロジックは一旦作成する必要がある。

2. 補正ロジック

以下のようなステップで補正ロジックを作成した。とても複雑なので、セルフチェックの意味も込めて記載する。

STEP①:各駅伝結果からのトラックタイム逆算

  1. 2020年以降の出雲・全日本・箱根の同区間出走ランナーを対象として、出走ランナーにおける5,000m(出雲)、10,000m(全日本・箱根)タイムの平均値を算出する
     
  2. 同様に2020年以降を対象として、同区間における各ランナーの区間タイム標準偏差・偏差値を算出する
     
  3. #2で算出した区間タイム標準偏差・偏差値は、トラックタイムでも同様の標準偏差・偏差値だと仮定して、#1で算出した平均値をもとに偏差値ベースでのトラックタイムの逆算値を算出する

ポイント①:5000m⇔10000mのタイム変換

今回、最終的な予測では10,000mトラックタイムを用いているが、出雲駅伝からは5,000mの逆算値算出を行っている。ではどのように10,000mに変換するか…。

世界陸連がワールドランキングというものを公表しているが、そのランキングは各種目におけるスコアに基づいている。そのスコアは各種目の記録に対して付与されるものになる。

そのスコア変換テーブルを参照して、5000mと10000mのトラックタイムの紐づけを行った。
例えば5000m 13:47:84 / 10000m 29:00:51に対しては、どちらも1041ptが付与される。よってこのタイムは同等とみなす、というようなロジック。

参考:WORLD ATHLETICS -Technical Information -SCORING TABLES

STEP②:各逆算値の集約

STEP①で算出した出雲・全日本・箱根の区間タイムから逆算したトラックタイムを、以下のパターンに応じて集約する。

  • 過去出走大会が計2大会以上あり、箱根駅伝にも出場している場合
    シンプルに平均
     
  • 過去出走大会が計2大会以上あるが、箱根駅伝に出場していない場合
    出雲・全日本のみでまず平均値を算出、その後箱根は100%と仮定して、2データで平均をとる
     
  • 過去出走大会が1大会の場合
    逆算タイムと現持ちタイムの平均をとる
     
  • 過去出走していない場合
    空欄

STEP③:現持ちタイムとの比較・補正

最後に、現持ちタイムとの比較を実施する。目的は、逆タイム番長のトラックタイムの補正であることを忘れない。
以下のパターンに分けて比較を行い、最終的なトラックタイムを決定した。

①トラック持ちタイムが28:30以下の場合
トラック持ちタイムそのまま

②以下、トラック持ちタイムが29:30以上で過去2回以上出走している場合

  • 逆算値タイムが28:30以下の場合:28:30
  • 逆算値タイムが28:30以上でトラック持ちタイム以下の場合:逆算値タイム
  • 逆算値タイムがトラック持ちタイム以上の場合:トラック持ちタイム

③上記以外で過去1回以上出走している場合

  • 逆算値タイムが28:30以下の場合:28:30
  • 逆算値タイムが28:30以上トラック持ちタイム以下の場合:逆算値タイムとトラック持ちタイムの平均
  • 逆算値タイムが28:30以上でトラック持ちタイム以上の場合:逆算値タイム

④トラック持ちタイム29:30以下で過去出走していない場合
トラック持ちタイムそのまま
 
⑤トラック持ちタイム29:30以上で過去出走していない場合
各大学エントリーランナータイムの平均

ポイント②:様々なパターンを考えようとしすぎるあまり複雑怪奇に…

過去出走大会が1回なのにその結果を反映させるのは…等、場合分けパターンを色々考えすぎてしまった結果、複雑怪奇になってしまった。

来年度はこの場合分けも不要だろう…。

3. 補正結果

これによってどのような補正結果になったか、駒澤大で逆タイム番長だと思われる3人を例に以下に示す。

名前 補正前タイム 補正後タイム
山川拓馬 30:27 28:26
赤星雄斗 30:07 28:34
庭瀬俊輝 30:27 28:54

結構、妥当なのではないでしょうか……。

4. 限界

やはり、この補正をしたうえで近似を行う必要がある。 これに尽きる。

5. 次分析

次はいよいよ予測結果を載せる……。長かった…。何とか箱根駅伝に間に合わせようと殴り書きになったが、間に合いそうでよかった。。。

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1