Kaggle の新しいコンペとして日本でもおなじみ PUBGを題材にしたもの が追加されました。
「Playground」なのでTitanicやHouse Prices の次に何やろうかという人向けに概要・ルールなどを簡単に日本語化しました。
そもそもPUBGとは?という人はまずは
https://ja.wikipedia.org/wiki/PLAYERUNKNOWN%27S_BATTLEGROUNDS
こちらから。
日程
開始 2018/10/4
終了 2019/1/30 11:59(UTC)
元ページ:https://www.kaggle.com/c/pubg-finish-placement-prediction
概要 (Overview)
説明(description)
バトルロイヤル型のビデオゲームが世界を席巻しています。
100人のプレイヤーは素手で島に落とされ、プレイゾーンが縮小し続ける中最後の1人になるまで他のプレイヤーを探索し、掃討し、排除する必要があります。
PlayerUnknown'sBattleGrounds(PUBG)は5000万本を超える売り上げを誇る大人気のゲームで、これは歴史上5位の記録となっています。
またアクティブプレーヤーの数は数百万人/月と現在も活発に遊ばれています。
PUBG開発チームは 「The Blue Circle」(訳注:PUBG用語。フィールド上で段々狭まってくる生存可能領域。この円の外にいるとダメージが発生して生存できなくなる)の外を探索して掃除するための公式のゲームデータを公開しました。
このコンぺはKaggleがPUBG Developer APIを使用して収集したデータを使用する非公式なものです。
65000ゲーム以上の匿名化されたプレーヤーデータをトレーニングセットとテストセットに分割しました。データに含まれる最終的なゲーム内のスタッツと初期プレーヤーの評価からプレイヤーの最終的な順位を予測して下さい。
PUBGで勝つ最良の戦略は何か?ひとつの場所で芋るべきかトップショットになるべきか?
さぁデータと会話して導き出しましょう!
評価方法
評価は予測したwinPlacePercと実際に観測されたwinPlacePercの間のMeanAbsoluteError(平均絶対誤差)で評価されます。
提出ファイル
テストセットの各IDに対してwinPlacePerc変数のプレースメントをパーセンテージ(最後は0、最初は1)として予測する必要があります。ファイルにはヘッダーが含まれており次の形式を持つ必要があります。
Id,winPlacePerc
47734,0
47735,0.5
47736,0
47737,1 etc.
データページにあるsample_submission.csvが完全な提出サンプルのためそちらを参照してください。
賞品(Prize)
コンペが終了時点でリーダーボードの上位5つのソリューションと5つの最も人気のあるカーネルについて
締め切り時のupvoteの数によって決定されKaggleのノベルティが提供されます。
元ページ:https://www.kaggle.com/c/pubg-finish-placement-prediction/data
データの説明 (Data Description)
PUBGのゲームでは各試合(matchid)最大100人のプレーヤーで開始されます。
プレイヤーはチーム(groupid)に参加することができ、ゲーム終了時にランク付けされます(winPlacePerc)これはそのプレイヤーが死んだときに他の多くのチームがまだ生きているかどうかに基づいています。
ゲーム中、プレイヤーは様々な武器を拾ったり気絶したチームメイトを復活させたり車を運転したり、泳ぎ、走り、撃つことなど全ての結果を経験することができます。--それが遠くへ落ちたり自爆したりというようなことであっても。
データの各行に1人のプレイヤーのゲームスタッツが含まれるようフォーマットされた多数の匿名化されたPUBGゲームの統計が提供されています。
データは「ソロ」「デュオ」「チーム」「カスタム」のすべてのタイプのゲームが含まれています。ゲーム毎に100人の選手が存在し、
グループ当たり最大4人の選手がいるという保証はありません。
最終的なスタッツに基づいて1(1位)から0(ビリ)までのプレイヤーの最終順位を予測するモデルを作成する必要があります。
ファイル構成
- train.csv -- トレーニングセット
- test.csv -- テストセット
- sample_submission.csv -- 提出CSVファイル(正しいフォーマット)のサンプル
データフィールド
カラム名 | |
---|---|
DBNOs | 敵プレイヤーを気絶させた数(down but not out) |
assists | チームメイトが倒した敵にダメージを与えた人数 |
boosts | ブースとアイテムを使用した数 |
damageDealt | 与えたダメージ総数(自傷分は除く) |
headshotKills | ヘッドショットで倒した敵の数 |
heals | 回復アイテムの使用数 |
killPlace | 1ゲーム内での敵を倒した数のランク |
killPoints | kill数ベースの外部ランキング(Eloレーティングとして考える) |
killStreaks | 短時間で倒した敵の最大数 |
kills | 敵プレイヤーを倒した数 |
longestKill | プレイヤーとプレイヤーが倒した敵が死亡した時の最長距離(これはプレイヤーを倒してから遠ざけても長くなるので注意が必要) |
matchId | 試合ID(トレーニングセットとテストセットで一致するものはない) |
revives | チームメイトを蘇生させた数 |
rideDistance | 車両での走行距離の合計(メートル単位) |
roadKills | 乗り物乗車中に倒した敵の数 |
swimDistance | 泳いだ合計距離(メートル単位) |
teamKills | チームメイトを倒した数 |
vehicleDestroys | 破壊した車両の数 |
walkDistance | 足で移動した合計距離(メートル単位) |
weaponsAcquired | 取得した武器の数 |
winPoints | 勝利ベースの外部ランキング(Eloレーティングとして考える) |
groupId | 試合中でのグループID(同じグループのプレイヤーが異なる試合でプレイするとグループIDも異なる) |
numGroups | 試合中のグループ数 |
maxPlace | 試合中の最低順位.時々データが順位付けをスキップすることがあるのでnumGroupsと一致しないことがある。 |
winPlacePerc | 予測対象。1位が1 最下位が0に対応したパーセンテージで表現された最終順位。これはnumGroupではなくmaxPlaceから計算される為、試合中の一部の情報のまとまりが失わている可能性がある |