はじめに
みなさんこんにちは。何気にQiitaには初投稿です。
つまり、童貞を今卒業したことになります。
今回は、ジーズアカデミーのアドベントカレンダーということで、エンジニアになりかけの僕が勇気を振り絞って書いています。よろしくどうぞ。
今回は、僕が大好きなサッカーと、来月から仕事で使うプログラミングをどうにか繋げられないかと思いまして、今年のJリーグのデータを可視化してみました。
(正直エクセルでもできる話だったんですが、一応プログラム書いてデータを可視化しています。)
海外のサッカーと比べてJリーグの人気はイマイチですが、1人でも多くの人にJリーグに対して興味を持ってもらえればと思って書きます。笑
(昨日のクラブワールドカップ、みましたよね?レアルを本気にさせた鹿島を!!)
まずは今年の成績の振り返り
Jリーグに詳しくない人のために、今年のJリーグの結果を軽く振り返りましょう。
【優勝】鹿島アントラーズ
(年間勝ち点3位:チャンピオンシップ優勝のため、2016年度Jリーグチャンピオン)
【準優勝】浦和レッドダイヤモンズ
(年間勝ち点1位:チャンピオンシップ準優勝のため、2016年度Jリーグ2位)
【3位】川崎フロンターレ
(年間勝ち点2位:チャンピオンシップ3位のため、2016年度Jリーグ3位)
詳細はJリーグのサイトにてご確認ください
年間勝ち点は浦和、川崎、鹿島の順でしたが、トーナメント方式のチャンピオンシップは鹿島が制して2016年王者となりました。浦和ファンとしては怒りが数日おさまらなかったかと思います。
今年のJリーグは2ステージ制&チャンピオンシップの有無についての賛否や、DAZNの放映権の話題、久保建英(15歳)のJリーグデビューなど、注目すべき話題はたくさんあった年でした。ちなみに今年のイチオシ選手は、ガンバ大阪の井手口陽介です。来年もまたJリーグが楽しみです。
さて、前置きが長くなりましたが、優勝争いに絡んだ3チームのデータを見て、どんな要因があったのかを探りたいと思います。
とはいえ、サッカーはカオスなスポーツであり、定量化が難しい部分もあるので、今回は簡易的に得点、失点、得点パターン、得点時間帯、失点時間帯という要素を持ち出して分析をしてみたいと思います。
データのビジュアライズにはchart.jsを使ってみました。
上位3チーム得点数
特筆すべきは川崎の68得点。試合数が全体で34試合ですので、1試合平均2点を叩き出しています。風間監督の攻撃サッカーが大輪の花を咲かせた年でした。
鹿島はセカンドステージでの不調が原因で得点数は伸び悩んでいますが、全体を通して「点を取りたいときに取りきれる」鹿島らしい勝負強さは随所に光っていました。
各チーム失点数
浦和はシーズンを通して28失点、鹿島は34失点と、どちらのクラブも非常に守備が堅いことが伺えます。
逆に川崎は少し失点が多いですが、それを補うことのできる攻撃陣が躍進を支えていたというのが所感です。
状況別勝敗(先取点を取った試合)
次に、試合状況(先取点を取った場合)での勝敗を見てみましょう。サッカーは先取点をとったほうが有利なスポーツですが、優勝に近づいたチームが先取点をとった際にどれだけ勝てたのかをグラフに表してみます。
驚きの数字が出ました。
浦和と川崎は先取点を取ると90%以上の確率で勝っています。引き分けに持ち込まれたケースを考慮すると、浦和、川崎は1回も負けていません。要するに、今年のデータからいえば、浦和も川崎も「先取点を取れば絶対に負けない」というものすごいクラブだったわけですね。
ちなみに鹿島も先取点を取ったケースでは76.2%の確率で勝ち、引き分けを含めて考えると90%以上の確率で負けないことがデータからわかりました。
ちなみに参考までに、下位3クラブ(来季J2降格クラブ)においては
湘南ベルマーレ 53.8%
名古屋グランパス 46.7%
アビスパ福岡 33.3%
とあまり高い確率で勝てていません。この辺も後で考察に書ければと思います。
状況別勝敗(前半をリードして折り返した試合)
今度は、前半終了時にリードをして折り返したケースを見てみましょう。これは先ほどの先取点よりも、さらに確率が高まりそうです。
意外と先ほどの先取点を取ったケースと変わらないですが、やはりどのクラブも高い確率で勝っていますね。ちなみに鹿島は前半終了時にリードをしていて負けた試合は、今シーズンに限っていえば1度もありませんでした。(10勝1分)
ちなみに参考までに、下位3クラブ(来季J2降格クラブ)においては
湘南ベルマーレ 100%
名古屋グランパス 70%
アビスパ福岡 20%
となっていました。やはりこちらも安定的に高い数字が出ていないことがわかるかと思います。
各チーム得点時間帯
左から鹿島、浦和、川崎となっています。
鹿島は後半開始時、試合終了直前の得点が多く、浦和は前半の終わり頃から得点の確率が高まってますね。鹿島は伝統の試合巧者ぶりがよく分かるデータです。浦和は続けてきたサッカーのスタイルが円熟期を迎え、後半型の戦い方を身につけたことがデータから見ることができます。
川崎については、試合終了前に多くの得点が入っています。川崎はアディショナルタイムに逆転したり、逆に失点して追いつかれたり劇的なゲームが多いですが、それもデータに現れていますね。
各チーム失点時間帯
各チームの失点時間帯を見ると、浦和の守備の固さが目立ちます。バランスよく失点している、という表現が正しいか分かりませんが、失点の時間帯にばらつきが少ないですね。
得点においてもそうですが、各チーム、後半になると失点しやすくなる傾向はあるようです。疲れが出てくる時間帯なので当たり前なのですが、それをデータとして再認識することができました。
各チーム得点パターン
鹿島
鹿島の得点パターンを見ると、約半数がセットプレーとクロスからの得点となっています。サイドを起点に攻めて、手堅くセットプレーで点を取る、鹿島らしいデータですね。
浦和
浦和の得点パターンを見ると、クロスからの得点が非常に多くなっています。攻める時にはサイドバックの選手が積極的に上がって2バック(時には1バック)の形で攻めるケースが多く、サイドの選手もドリブラーが多いことからサイドからの攻撃を中心に組み立てていることがこのデータからも分かります。
川崎
最後に、川崎の得点パターンを見てみましょう。こちらは先ほどの2チームとは違い、ショートパス、スルーパスからの得点が多いですね。川崎の細かいパスを繋ぎながらゴールを陥れるスタイルがデータからもみてとれます。
各チーム失点パターン
鹿島
鹿島の失点パターンを見ると、セットプレーから、クロスからの失点が少ないですね。サッカーにおいては重要な得点パターンであるセットプレー、サイド攻撃からの失点を少なくすることで、接戦をものにしてきた印象があります。
浦和
浦和も鹿島と似ていてセットプレーから、クロスからの失点が少ないですね。また、その他(オウンゴールや味方にボールが当たってコースが変わってしまっての失点)の分野の失点が多いため、全体で見ると崩されての失点は非常に少なかったと言えるかもしれません。僕はレッズファンではないですが、外から見ていて守備は非常に安定していましたので、安心して試合を見ることができた印象が強いです。
川崎
川崎の失点パターンで特徴的なのは、セットプレーからの失点が多く、クロスから崩されての失点が少ない点ですね。セットプレーでの失点が多いのでチームとしては試合運びが不安定な時もありますが、そこを攻撃力でうまくカバーをしている印象です。また、個人的にはこの3チームの中では一番ディフェンスラインの高さの面では劣るチームだと思っていたので、クロスからの失点が少ないのは少し驚きでした。
考察
当たり前ではありますが、得点を多く取り、失点を少なくする、そして勝ちに行くのがサッカーというスポーツです。点を取るための手段としてはチームによって異なりますし、点を取られないための手段もしかりです。
例えば年間勝ち点1位だった浦和レッズというチームは、守備をしっかりと構築し、奪ったボールを再度へ展開、そこからサイドに張っている攻撃的な選手がドリブルで仕掛けてチャンスを作っていくスタイルのチームです。もう少し言えば、サイドバック(サイドの守備的な選手)もどんどん攻撃のエリアに侵入してくるので、その結果、サイド攻撃が機能してクロスからの得点が増えました。
また、得点・失点の時間帯をみてみると、どのチームも前半よりも後半の方が数字が大きくなっています。これも直感的にはわかることですが、改めてデータを可視化してみると疲れやミスの出やすい後半に得点が生まれる、という現象が起こるスポーツであることがわかりますね。
ちなみに、得失点の時間帯については下位3チームについてもデータをとってみましたが、確率的にはそんなに大きな差は出ませんでした。特に前半と後半での得失点の確率の平均値はほぼ同じで、その点は(少なくともJリーグの中では)全体的な傾向なのかもしれません。
また、リードしている状況での試合運びに関しては、結果論ではありますが上位と下位に明らかに大きな差があったと思います。上位のチームに関しては守備が安定しているのもありますが、やはり試合を終わらせる方法をしっかりと持てていたと思います。
そして得点パターンを見てみると、チームの特徴である攻撃+セットプレーでの得点数が多い傾向にありました。浦和、鹿島、川崎共に半分以上が上記のパターンからの得点で、「自分たちの攻撃スタイルを確立している」「拮抗した状況で、セットプレーから得点を取れる」という強みを持っているように感じました。全チーム、優れたセットプレーのキッカーがいることも原因の一つですね。
少し長くなりましたが
・守備の安定
・リードしている状況での試合運びのうまさ
・チームの特徴である攻撃+セットプレーでの得点数が多い
これらの多くの要素が当てはまるチームが上位に来ているチームなのだと、今回のデータを可視化した際に感じました。
この話、サッカーやってる人からしたら当たり前なんですが。笑
(当たり前のことがデータから「も」わかったということで!笑)
終わりに
実は最初はデータ分析的なことをPythonとか使ってやろうと思ったんですが、時間がなくて中々手が出せず…。まずは簡単なデータビジュアライズでも良いかなと思い今回は記事を書きました。
やってみて感じたことは、データ分析は技術よりもまず、「どういう切り口でデータを見せるか」という点が非常に大事だということ。
もちろん技術を否定するわけではありませんが、意味もわからず機械学習やPythonに手を出すよりも、まずはわかりやすい数字を比較する、という誰でもわかる手法を用いるのがファーストステップだなと感じました。
統計学的な処理や、機械学習などはそのあと段階で良いなと思います。
もちろん、そこまでできればベストですが。笑
来年はもっとパワーアップした形で分析をしてみたいと思います。ではでは。