はじめに
この記事を目にした方ならkaggleやsignateなどプラットフォームについて聞いたことがある、参加したことがあるかもしれません。KaggleとSIGNATEは、データサイエンスや機械学習に特化した競技プラットフォームです。
Kaggleはグローバルに展開され、多彩な企業や研究機関が提供するデータセットと課題を通じて、データ分析スキルを競う場を提供します。
一方、SIGNATEは日本発のプラットフォームで、国内企業や団体が提供する課題を中心に、実務に近い分析やAIモデル開発に挑戦できます。
どちらもランキングや賞金があり、学びやキャリアアップに最適です。初心者からプロまで幅広い層に対応しています。
Begginerコンペというのとゲームの勝敗というのにひかれて初めて参加してみました。
PCゲームの勝敗予測:内容
学習用データ、評価用データ、サブミッション用ファイルの3つが与えられます。
データの中身はこんな感じです
特徴量エンジニアリング
自分はこのゲームを知っていて一時期結構やりこんでいました。これはleague of legendsという5v5のゲームで相手の拠点を先に壊した方が勝利というゲームです。このゲームについては結構詳しく知っていたので調べに行く必要はありませんでした。
データ欠損やダミーかする必要のあるデータはなかったためこのゲームで重要な
kill-deathキルデス差そして、戦闘が起きた時にチームの連携力という点でkill*assistというのも作りました。
またこのゲームはfirstBloodに追加のお金が入るようになっており普通のkillより多くお金がもらえるためキルデス差に+1した値を追加しました。
モデルの選択
様々な手法を試してみてクロスバリデーションで予測を実行し、特に精度の高かった”SVM””lightBGM”"rondomforest"をアンサンブルしました。
まだ今回のコンペが終わっていないためコードは後悔しませんが終わり次第公開します。
終わり
今のところ12位という結果なので自分はこのゲームの知識背景がある分1桁順位で終われるよう引き続き頑張っていきたいと思います。