LoginSignup
18
12

More than 5 years have passed since last update.

Kaggle PUBG Finish Placement Prediction 日本語訳

Last updated at Posted at 2018-10-13

Kaggle の新しいコンペとして日本でもおなじみ PUBGを題材にしたもの が追加されました。
「Playground」なのでTitanicやHouse Prices の次に何やろうかという人向けに概要・ルールなどを簡単に日本語化しました。
そもそもPUBGとは?という人はまずは
https://ja.wikipedia.org/wiki/PLAYERUNKNOWN%27S_BATTLEGROUNDS
こちらから。

日程

開始 2018/10/4
終了 2019/1/30 11:59(UTC)


元ページ:https://www.kaggle.com/c/pubg-finish-placement-prediction

概要 (Overview)

説明(description)

バトルロイヤル型のビデオゲームが世界を席巻しています。
100人のプレイヤーは素手で島に落とされ、プレイゾーンが縮小し続ける中最後の1人になるまで他のプレイヤーを探索し、掃討し、排除する必要があります。

PlayerUnknown'sBattleGrounds(PUBG)は5000万本を超える売り上げを誇る大人気のゲームで、これは歴史上5位の記録となっています。
またアクティブプレーヤーの数は数百万人/月と現在も活発に遊ばれています。

PUBG開発チームは 「The Blue Circle」(訳注:PUBG用語。フィールド上で段々狭まってくる生存可能領域。この円の外にいるとダメージが発生して生存できなくなる)の外を探索して掃除するための公式のゲームデータを公開しました。

このコンぺはKaggleがPUBG Developer APIを使用して収集したデータを使用する非公式なものです。

65000ゲーム以上の匿名化されたプレーヤーデータをトレーニングセットとテストセットに分割しました。データに含まれる最終的なゲーム内のスタッツと初期プレーヤーの評価からプレイヤーの最終的な順位を予測して下さい。

PUBGで勝つ最良の戦略は何か?ひとつの場所で芋るべきかトップショットになるべきか?
さぁデータと会話して導き出しましょう!

評価方法

評価は予測したwinPlacePercと実際に観測されたwinPlacePercの間のMeanAbsoluteError(平均絶対誤差)で評価されます。

提出ファイル

テストセットの各IDに対してwinPlacePerc変数のプレースメントをパーセンテージ(最後は0、最初は1)として予測する必要があります。ファイルにはヘッダーが含まれており次の形式を持つ必要があります。

Id,winPlacePerc
47734,0
47735,0.5
47736,0
47737,1 etc.

データページにあるsample_submission.csvが完全な提出サンプルのためそちらを参照してください。

賞品(Prize)

コンペが終了時点でリーダーボードの上位5つのソリューションと5つの最も人気のあるカーネルについて
締め切り時のupvoteの数によって決定されKaggleのノベルティが提供されます。


元ページ:https://www.kaggle.com/c/pubg-finish-placement-prediction/data

データの説明 (Data Description)

PUBGのゲームでは各試合(matchid)最大100人のプレーヤーで開始されます。
プレイヤーはチーム(groupid)に参加することができ、ゲーム終了時にランク付けされます(winPlacePerc)これはそのプレイヤーが死んだときに他の多くのチームがまだ生きているかどうかに基づいています。
ゲーム中、プレイヤーは様々な武器を拾ったり気絶したチームメイトを復活させたり車を運転したり、泳ぎ、走り、撃つことなど全ての結果を経験することができます。--それが遠くへ落ちたり自爆したりというようなことであっても。

データの各行に1人のプレイヤーのゲームスタッツが含まれるようフォーマットされた多数の匿名化されたPUBGゲームの統計が提供されています。
データは「ソロ」「デュオ」「チーム」「カスタム」のすべてのタイプのゲームが含まれています。ゲーム毎に100人の選手が存在し、
グループ当たり最大4人の選手がいるという保証はありません。

最終的なスタッツに基づいて1(1位)から0(ビリ)までのプレイヤーの最終順位を予測するモデルを作成する必要があります。

ファイル構成

  • train.csv -- トレーニングセット
  • test.csv -- テストセット
  • sample_submission.csv -- 提出CSVファイル(正しいフォーマット)のサンプル

データフィールド

カラム名
DBNOs 敵プレイヤーを気絶させた数(down but not out)
assists チームメイトが倒した敵にダメージを与えた人数
boosts ブースとアイテムを使用した数
damageDealt 与えたダメージ総数(自傷分は除く)
headshotKills ヘッドショットで倒した敵の数
heals 回復アイテムの使用数
killPlace 1ゲーム内での敵を倒した数のランク
killPoints kill数ベースの外部ランキング(Eloレーティングとして考える)
killStreaks 短時間で倒した敵の最大数
kills 敵プレイヤーを倒した数
longestKill プレイヤーとプレイヤーが倒した敵が死亡した時の最長距離(これはプレイヤーを倒してから遠ざけても長くなるので注意が必要)
matchId 試合ID(トレーニングセットとテストセットで一致するものはない)
revives チームメイトを蘇生させた数
rideDistance 車両での走行距離の合計(メートル単位)
roadKills 乗り物乗車中に倒した敵の数
swimDistance 泳いだ合計距離(メートル単位)
teamKills チームメイトを倒した数
vehicleDestroys 破壊した車両の数
walkDistance 足で移動した合計距離(メートル単位)
weaponsAcquired 取得した武器の数
winPoints 勝利ベースの外部ランキング(Eloレーティングとして考える)
groupId 試合中でのグループID(同じグループのプレイヤーが異なる試合でプレイするとグループIDも異なる)
numGroups 試合中のグループ数
maxPlace 試合中の最低順位.時々データが順位付けをスキップすることがあるのでnumGroupsと一致しないことがある。
winPlacePerc 予測対象。1位が1 最下位が0に対応したパーセンテージで表現された最終順位。これはnumGroupではなくmaxPlaceから計算される為、試合中の一部の情報のまとまりが失わている可能性がある
18
12
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
18
12