今回私は、初めてコンペティション(通称コンペ)に参加しました。この記事では、そこで学んだことや必要だった知識などを振り返りを兼ねてまとめていきたいと思います。
コンペティション概要
主催
- 日本統計学会スポーツデータサイエンス分科会
- 情報・システム研究機構統計数理研究所
協賛
- データスタジアム株式会社
- 株式会社セガ
後援
- 一般社団法人日本スポーツアナリスト協会
- 統計数理研究所医療健康データ科学研究センター
参加資格
以下の条件を満たす個人またはチームが参加可能です
-
日本統計学会スポーツデータサイエンス分科会会員
(入会フォームあり) - 大学で統計学・統計科学を教える教員、または博士課程(博士後期課程)の大学院生を代表者とすること
- 修士課程(博士前期課程)の学生や学部生が参加する場合、必ず教員を代表者とすること
- メンバーは5名以内(責任者を除く)
- 民間企業に勤める者はチーム構成員に含まないこと
スケジュール
- 2024年9月30日(月): 申込締切(メンバー追加もこの時点まで)
- 2024年11月22日(金) 17:00: 書面審査(アブストラクト提出)締切
- 2024年12月初旬: 審査結果発表
- 2025年1月11日(土)-12日(日): 審査会@同志社大学今出川キャンパス(ハイブリッド開催)
- 2025年1月下旬: 受賞者決定
チーム構成
メンバーは以下の構成で参加しました
- 大学の課外活動で集まった4人
- 責任者の教員
メンバーは大学の課外活動で集まった4人と責任者の先生についてもらうことになりました。スポーツのデータ分析をするコンペということで、「野球」「サッカー」「バスケ」「eスポーツ」がありましたが、私たちの班ではサッカーで行うことになりました。
提供されたデータについて
データ全般
- 対象: J1リーグ(2022年・2023年それぞれの30~34節の試合、計45試合)
- 内容: ボール推定位置(選手のボールタッチデータから等速直線運動で推定)
説明資料
- ① サッカー_ボールタッチデータ説明資料.xlsx
- ② サッカー_トラッキングデータ説明資料.xlsx
データファイル
-
試合情報:
2022_J1_全テキスト速報.xlsx
2023_J1_全テキスト速報.xlsx
- 出場選手プロフィール情報.xlsx
-
詳細データ:
-
play.csv
(ボールタッチベースの時系列データ) -
players.csv
(選手プロフィールデータ) -
tracking.csv
(トラッキングデータ)
-
データの特徴と注意点
play.csv
の概要
- 1試合あたり約2000行(全試合で約90000行)
-
123列(うち4列は
Object型
)
データの可視化
-
チーム名: 284/90000行がNull
→ チームIDで補完可能 - 選手ID: 選手に関係しないアクションは-1、判別できない場合は0
-
選手名: 320/90000行がNull
→選手の判別はこれを基にやればいいと思う。次の選手のプレーやトラッキングデータから補間できるかも -
選手背番号: 1350/90000行がNull
→このplay.csvはボールタッチベースの時系列データなので、Nullで登録されている同じ選手が、何回も登場して、この値になっている可能性がある -
方向4: 6944/90000行がNull(約7.7%)
→これは7.7%Nullであるので、まあ使えると思う。でも方向は映像を見て手動で入れられているデータなので補間は出来ないと思う。でも、選手とボールのトラッキングデータで補間できるかもしれない
分析テーマ
J1リーグにおける攻撃時の守備プレッシャーに関する研究
~上位チームと下位チームの特徴分析~
サッカーは11人の選手が広大なピッチ上で連携し、戦略的に相手チームを攻略するスポーツです。特に注目すべきは、他のチームスポーツと比べてピッチが広く選手数が多いという特徴から、ポジショニングが非常に重要な要素となっています。
私たちの研究チームは、J1リーグの試合における「守備プレッシャー」という観点から、上位チームと下位チームの攻撃特性の違いを分析しました。具体的には、シュート選手とアシスト選手の周囲3メートル以内にいる守備選手の数を、以下の3つの重要な場面で比較検証しました
- アシスト選手がパスを出す瞬間
- シュート選手がボールをトラップする瞬間
- シュート選手がシュートを打つ瞬間
研究対象として、上位チームからは「横浜F・マリノス」「ヴィッセル神戸」「川崎フロンターレ」「サンフレッチェ広島」を、下位チームからは「ジュビロ磐田」「横浜FC」「清水エスパルス」「京都サンガF.C.」「柏レイソル」「ガンバ大阪」を選定し、2022年および2023年のデータを分析しました。
興味深い研究結果
当初、私たちは「上位チームはアシスト選手が多くの守備選手を引き付け、それによってシュート選手の周囲の守備選手が少なくなるだろう」という仮説を立てていました。しかし、実際の分析結果は非常に興味深いものとなりました。
-
パス時の特徴
予想に反して、下位チームの方がアシスト時により多くの守備選手を引き付けていることが判明しました。これは上位チームが必ずしも「守備を引き付ける」という戦術に依存していないことを示唆しています。 -
トラップ時の特徴
同様に、下位チームの方が守備選手を回避してトラップを行えていることが分かりました。特に1位と18位を比較した場合に、この傾向が顕著に表れました。 -
シュート時の特徴
しかし、最も重要なシュートの瞬間では、上位チームの方が明らかに守備選手から離れた位置でシュートを打てていることが確認されました。これは上位チームの方が、最終的な決定機においてより質の高い状況を作り出せていることを示しています。
研究から見えてきた示唆
この研究結果から、以下のような興味深い示唆が得られました
-
上位チームは、必ずしも「アシスト選手が守備を引き付け→シュート選手が空いたスペースを使う」という単一のパターンに依存せず、より多様な攻撃パターンを持っている可能性があります
-
比較するチーム数が少ないほど(例:1位vs18位)、上位・下位チーム間の差が顕著になることが分かりました。これは、リーグの最上位と最下位では、かなり異なる戦術的特徴を持っていることを示しています
-
上位チームは、パスやトラップの過程での守備プレッシャーの数よりも、最終的なシュート時の質を重視している可能性があります
この研究は、サッカーの戦術分析における新しい視点を提供するとともに、チームの競技力向上に向けた具体的な示唆を与えるものとなりました。今後は、さらに他のプレー動作を用いた分析や特定エリアに着目した分析を進めることで、上位チームと下位チームの特徴をより明確化し、リーグ全体のレベルアップに貢献できると考えています。
サッカーのデータ分析コンペに初参加して
今回、初めてサッカーのデータ分析コンペティションに参加させていただき、非常に多くの学びと発見がありました。以前から興味はあったものの、なかなか一歩を踏み出せずにいたのですが、今回チームで参加することができ、とても良い経験となりました。
データ分析の難しさと面白さ
サッカーのような流動的なスポーツでは、どのようなデータを取得し、どう分析するかという点から検討が必要でした。今回は「守備プレッシャー」という観点に着目し、選手の周囲3メートル以内にいる守備選手の数を分析するというアプローチを取りましたが、この指標を決めるまでにも様々な議論を重ねました。
当初立てていた仮説が覆されたことも、研究の面白さを感じた点の一つです。上位チームは守備を引き付けてスペースを作り出すだろうと考えていましたが、実際のデータからは異なる傾向が見えてきました。このような「思い込みを数値で検証できる」というのが、データ分析の醍醐味だと感じました。
チームでの研究の意義
個人での分析ではなく、チームで取り組めたことで、様々な視点からの意見を取り入れることができました。データの解釈の仕方や、新たな分析アプローチの提案など、メンバー間での活発な議論が研究の質を高めることにつながったと感じています。
今後の展望
今回の経験を通じて、さらに深く掘り下げたい部分がいくつも見つかりました。例えば、特定のエリアに焦点を当てた分析や、時間経過による変化の検証など、まだまだ探究できる部分は多いと感じています。
また、今回得られた知見を実際のサッカーの現場にどう活かせるのか、という実践的な部分にも興味が湧いてきました。データ分析を単なる数字の羅列で終わらせるのではなく、現場で活用できるよう、今後も研究を続けていきたいと考えています。