LoginSignup
1
1

箱根駅伝データ分析物語 #2-1:箱根高速化(散布図-往路)

Last updated at Posted at 2023-12-22

箱根駅伝に関連した最近のバズワードとして、「高速化」 が挙げられる。

2018年頃から浸透し始めたNIKEのズームヴェイパーフライ4%を皮切りに、今ではほぼすべての箱根ランナーが着用している厚底シューズによるタイム高速化 のことである。

厚底シューズの細かい機能は僕もよく分かっていないのだが、とりあえず靴底を厚くするとタイムが早くなるらしい。
各メディアの箱根駅伝×厚底シューズの記事をみても、2020年には「高速化」、2022年以降は「超高速化」という見出しが多い。

IMG_4680.jpeg

画像出所:
超高速化まざまざ、区間歴代5位以内を計14人がマークした箱根駅伝…圧巻は中央大・吉居大和と駒沢大・田沢廉

(めちゃくちゃ画像が大きくなっている気がする…笑)

前記事(以下)では、まず出走時の10,000mベスト×区間タイムの散布図を作成したが、今後の箱根駅伝を予測するうえでは、厚底シューズによる影響を加味する必要があることも考えられる。

箱根駅伝データ分析物語 #1-1:傾向把握(往路)
箱根駅伝データ分析物語 #1-2:傾向把握(復路)

そこで本記事では、箱根駅伝において厚底シューズが浸透する前後で区間記録が有意に変化したのかを見ていくことにする。

1. はじめに

上述したものがはじめにに該当するので、割愛(なぜ設けた)

2. 箱根高速化分析

箱根高速化分析は、せっかくなので以下の2つの観点から実施

1. 散布図で厚底シューズ浸透以降をハイライトし、可視化して比較
2. 統計学的手法を用いて定量的に比較

例のごとく3日坊主防止のため、本記事では1について記載し、また往路に限定する(復路&2についてはまた別記事)

2.1. 分析目的

厚底革命により箱根駅伝は超高速化されたという認識をいちファンとして持っているが、定量的にそう言えるのかを検証する。
もし定量的にも確認できた場合、箱根駅伝の予測モデル構築においては、高速化の影響を加味(直近レコードのみの抽出や説明変数としての特出し等)する必要がある。

2.2. 分析前提

分析を行ううえでは、第何回大会から厚底シューズが浸透したとみなすのかを設定する必要がある。

男性長距離走選手の厚底シューズの着用がランニング障害に及ぼす影響
では、厚底シューズについて以下のように言及している。

2019年の第95回箱根駅伝では厚底シューズの使用割合が37.8%だったのに対し,2020年の第96回箱根駅伝では93.3%と厚底シューズの着用率が増加したことを報告している

これを見ると第96回大会以降を「厚底シューズ浸透」とみなすことが適切のように思える。
しかし僕の方でこの論文を見つけるのが遅く、既に95回以降を「厚底シューズ浸透」とみなして分析してしまっていた…。

心残りではあるがやり直すのが手間&変更するとデータ数的にも少なくなってしまうので、一旦このままでいく。(来年度以降など分析を更新するときに変更する)

ただ、『箱根駅伝2019総括、ナイキシューズの躍進を分析』によれば、
第95回大会でも厚底シューズのシェアはダントツで1位のようなので、結果にはそこまで影響を与えないと信じたい。

2.3. 散布図分析

まずは、前記事で既出の10,000mベストタイム×区間タイムの散布図を活用して分析を実施する。

2.2.1. 分析方法

実施内容

過去データを載せた既出の10,000mベストタイム×区間タイムの散布図において、厚底シューズ浸透の第95回以降のデータプロットの色を変えることで、変化を可視化する。

元データ

誠に勝手ながらこちらを参照させていただきました!すみません!ありがとうございます!
箱根駅伝・過去のデータ集

かなり過去の記録まで遡って記載いただいていたが、
すべての区間レコードではなく、区間タイムTOP300までのレコードに絞って載せられていたので、分析対象データも絞っている。
(コース変更後は最新コースの記録のみ反映)

データ整形処理

元データを抽出後、以下処理を実施

  • 出走時に10,000mトラックの記録を持たないランナーのレコードは除外
  • 学連選抜等OP参加のランナーのレコードは除外

また、今回は散布図に対して近似直線を付与するが、
レコード数が十分でないことにより、明らかな外れ値(トラックタイムは良くないがロードで爆走する選手やアクシデント等)が含まれると、その値に引っ張られて正しい傾向が見えづらくなる。

そこで今回は、まずは全データにおいて近似直線を引き、
近似直線からの距離が遠い上振れ、下振れそれぞれ上位2.5%のデータを外れ値とみなし、
当該データを除外したうえで再度近似直線を付与した。

2.3. 分析結果

95回以降(厚底浸透後)、94回以前(厚底浸透前)それぞれのプロットに対する近似曲線を付与しています。

各図における近似直線の傾きが大きい区間は相関が強く、小さい区間は相関が弱いわけではないことに留意。(データ標準化が必要なため)

1区:スターター区間

第95回以降 オレンジ色 N=83
第94回以前 青色 N=206

縦軸:1区区間タイム
横軸:出走時10,000mベストタイム

IMG_4708.png

  • 直近5年(オレンジ)の方が全体的に近似曲線は下にあるため、高速化していることが読み取れる
  • ただ以前までは準エース級を配置することの多い区間だったが、近年は凌ぐことを目的にするチームが増え差がつきづらくなったためか、傾きは直近5年の方が緩やか
  • 吉居大和(98回)の記録や佐藤悠基(83回)の記録は外れ値と判断され除外

2区:エース区間

第95回以降 オレンジ色 N=84
第94回以前 青色 N=204

縦軸:2区区間タイム
横軸:出走時10,000mベストタイム

IMG_4709.png

  • 直近5年(オレンジ)の方が全体的に近似曲線は下にあるため、高速化していることが読み取れる
  • 傾き自体もほぼ同程度のため、区間配置傾向はあまり変化なく、シンプルな高速化と想定される

3区:湘南の風区間

第95回以降 オレンジ色 N=88
第94回以前 青色 N=203

縦軸:3区区間タイム
横軸:出走時10,000mベストタイム

IMG_4710.png

  • 直近5年(オレンジ)の方が全体的に近似曲線は下にあるため、高速化していることが読み取れる
  • 傾きは直近の方が急のため、以前より差がつきやすくなっている区間
  • 突っ込んで耐える戦略が浸透したためか、タイムを持っているランナーが高速化の影響以上に好走するケースが増えていることが要因と想定される

4区:準エース区間

第95回以降 オレンジ色 N=99
第94回以前 青色 N=40
※コース変更があったため

縦軸:4区区間タイム
横軸:出走時10,000mベストタイム

IMG_4711.png

  • 直近5年(オレンジ)の方が全体的に近似曲線は下にあるため、高速化していることが読み取れる
  • 94回以前のサンプル数が少ないため一概には比較できないが、出走選手のトラックタイムの分布をみても、直近だと準エースが配置される区間に替わっている印象

5区:山登り区間

第95回以降 オレンジ色 N=99
第94回以前 青色 N=38
※コース変更があったため

縦軸:5区区間タイム
横軸:出走時10,000mベストタイム

IMG_4712.png

  • 直近5年(オレンジ)の方が全体的に近似曲線は下にあるため、高速化していることが読み取れる

往路5区間において、散布図に対する近似曲線の傾向としては、いずれも高速化によって区間タイムが明らかに上昇していることが読み取れた。

一旦今回の記事ではここまでにして、次は同様の分析を復路区間でも実施予定。

お願い

皆さまからのデータ提供など、いつでもお待ちしています。。。

参照

箱根駅伝データ分析物語 #1-1:傾向把握(往路)
箱根駅伝データ分析物語 #1-2:傾向把握(復路)
超高速化まざまざ、区間歴代5位以内を計14人がマークした箱根駅伝…圧巻は中央大・吉居大和と駒沢大・田沢廉
男性長距離走選手の厚底シューズの着用がランニング障害に及ぼす影響

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1