LoginSignup
7
1

More than 3 years have passed since last update.

ウイイレのデータ解析をかっこいいグラフで!

Last updated at Posted at 2020-02-17

ウイイレのデータ解析自動化してくよ! Part2

どうもヤジュンです!自己紹介はこちら

本記事は、ウイイレのデータ集計自動化してみた!の続きになります。
画像からデータ収集できるようになったので、早速「解析」~「考察」をしてみました。
実装機能の一部をご紹介します。

※本ソフトウェアは、pythonで作成しています。■参考サイト


■解析のゴール

  • 解析のゴールは、プレイヤーのモデル化としました!
    プレイヤーをモデル化するって、美少女やイケメンにするわけじゃないです。(ここ笑うとこ!)
    データから、「勝つ時」と「負ける時」のモデルをグラフ等で可視化するのです。
    「勝ちモデル」と「負けモデル」のギャップから、課題やプレイヤーの強みを明らかにします!

■流れ

  1. 各パラメータからグラフを作成
  2. 勝敗時のギャップ分析
  3. プレイヤーに対して課題を可視化 
  4. 次の解析方法の選定

■ヒストグラム & 散布図

【グラフ化】

  • 前回作成したメトリクス収集ソフトウェアで、テスターの30試合分の試合結果を集めました。
    テスターはなんと!あの「 ちゃまさん 」です!
    取得できるパラメータは80種類以上あります。
    全パラメータをグラフ化しても意味が薄いため、今回は例として4つ選択しました。

    ポゼッション
    攻撃エリア中央の比率
    パス本数
    ボール奪取数
    


    コメント 2020-02-18 210142.png

    (例)上から2マス目、左から1マス目の散布図は、縦軸「攻撃エリア中央の比率」横軸「ポゼッション」の散布図になります。

※補足
  • ヒストグラム散布図をご存じない方向けに簡単に説明します。
    左上の「ポゼッション」のヒストグラムは、「50%~55%」で棒のピークが来ていますよね?
    この棒は「該当するポゼッション(%)のデータが何個あったか」を示しています。
    「本テスターの試合結果では、ポゼッション50~55%の試合が多かった!」ということです。

【考察】

  • ではグラフを見ていきましょう!
    縦軸「ポゼッション」の一番上の行の散布図では綺麗に傾向が出てます。
    「攻撃エリア中央」の比率が上がれば、「ポゼッション」も上がっているので、点の分布が右肩上がり気味です。
    「パス本数」と「ボール奪取数」も同様の傾向です。

    他グラフでも傾向が見えますが、「勝ちと負け引き分けの差分を明らかにする」のは無理そうです。
    2つの情報だけでは、期待する結果が得られないことも多いです。

    ※ただ、今回は30試合分のデータだったので、これが100試合ともなると話は別です。
    1パラメータの情報量が増えるので、良い結果が見れたりします。

    では次!


■ヒートマップ解析

【グラフ化】

  • ボール奪取 及び ボールロストの情報を可視化していきます。


    コメント 2020-02-18 210754.png

【考察】

  • 「勝ち」と「負け引き分け」のギャップを見るなら、一番右のグラフが最適です。
    ボール奪取数の「負け引き分け」データは、敵陣内でのボール奪取が全体的に少ないのが分かりますね。
    (勝ち試合よりもボール奪取数が少ないエリアは青で示されています。)
    理由は色々考えられます。

    フォーメーションの組み合わせか?
    カウンターターゲットをつけているせいで、後ろで回されている?
    守備時にカーソル当ててる選手がいつもとズレている?
    

    次は、下図の「ボールロスト」を見ていきましょう!
    「ボール奪取」とは異なり、エリアによっては「負け引き分け」試合のが良い結果もありますね。
    気になったのは、前線のハーフスペース(左から2列目)でのボールロストが多くなっている点です。

    ハーフスペースでは、サイドも中央も使えて、なおかつ自身でシュートも狙える重要なエリアです。
    チャンスにも関わらず、ボールをロストしているということは色々な理由が考えられます。

    敵が近いにも関わらずスルーパスでビルドアップしている
    ダッシュボタンを押しぎみ
    サイドor中央の選択が偏り、相手に読まれている
    

    仮説を立てて、テスターにヒアリングしたり、動画などの追加データをもらって、検証していきます。
    次の解析につなげていくのです。

    では、次!


■複数パラメータ解析

【グラフ化】

  • 複数のパラメータ情報をまとめてグラフ化します!
    選択したのは、「パス本数」「パス成功率」「得点」「失点」の4つのパラメータです。


コメント 2020-02-18 210416.png

【考察】

  • 右図の「得失点」から、得失点0点以下の試合は、「パス成功率80%以下」にしかないことが分かります。
    逆にパス本数は影響してなさそうです。
    左図の「得点」も同様に、「パス成功率」が高い試合ほど得点が多いことが分かります。
    中図の「失点」は面白い結果が出てますね!
    パス成功率/パス本数ともに、失点数には影響していなそうです。

    このテスターにとって、「パス成功率は、攻撃力に影響するが、失点には関係なさそう」という結果得られました。
    次の解析は、以下を取るのが良さそうです!

     パス成功率を上げるにはどうすればいいか?
     失点数に影響している他のパラメータは何か?
    

■データ解析のコツ!

  • このようなデータ解析のコツとしては、パラメータの依存/内包関係を把握しておくことです!
    例えば「ポゼッション」というデータは、いくつもの因子が積みあがって出てくるパラメータです。

コメント 2020-02-18 203939.png

  • ん~~たくさん!!笑
    ただ、全てのパラメータを細かく見れば良いわけではないです。
    「欲しい情報はどの粒度で見るのが一番効率的なのだろう?」
    と意味のあるデータの塊を模索することが大切です。

■まとめ

  • やはり、最初のヒストグラムなどのチープな図よりも、リッチなグラフの方が価値の高い情報を得られますね。
    この記事を見て、プレイヤーの皆さんから「使ってみたい!」と思われたら幸いです。
    ニーズとマッチしていないものを作成しても、それはゴミと同じです。
    今後もテスターの方にご協力いただき、ソフトウェアの価値を高めていきます。

■今後の予定

  • 機能拡張を予定しています。
    ・フォーメーションと各パラメータの関係
    ・パラメータの変化量を把握するためのグラフ作成(週毎の成長などを見やすくする狙い)
    ・テンプレートマッチングを用いた文字認識精度100%化

    番外編として
    ・対抗募集を自動リツイートBOT

    part3をお楽しみに!!


■読んでくださった皆様へ

  • 私の活動に、ご興味のある方は、気軽にTwitterまでDMしてください♪
    「こんなことお願いできませんか?」みたいに、記事内容と関係ないことでも大丈夫です。

■参考URL

7
1
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
7
1