6
7

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

日本※で一番※ポーカーが上手い※のは誰か計算してみた(TrueSkill)~評価編~

Last updated at Posted at 2019-10-30

記事へのリンク

  1. 理論編
  2. 実装編
  3. 評価編(←本記事)

本記事におけるお断り

本記事は筆者が自学自習のためにデータ取得から計算までを行ったものです。特定の団体や個人から許可許諾はとっていないため、もし内容に問題があるとお考えの場合にはご連絡いただければ幸いです。
また、タイトルにもある通り、単純に強い、上手いを判断するのが困難であるポーカーにおけるスキルの『推定』がやりたかったことです。
本記事を通じて少しでもポーカーに興味を持ってアミューズメントやオンラインでポーカーを始めたいと思う人が増えれば何よりです。

#実行結果
GitHubに計算した結果を格納しました。以下から参照&DL可能です。
列名等はReadMeをご覧ください。個人的な感覚では上二つがある程度良い感じの並び順だと思います
TrueSkillのエクスポース、レーティング順
TrueSkillのμ順
ELOレーティング順
仮の収支順
仮の収支順※レーキ10%
TrueSkillのσ順
出場回数順

#仮の収支?
全く実力評価とは関係ないですが、全トーナメントが参加に10,000必要かつ、一般的な人数を考慮したプライズストラクチャーだった場合、
いくらの損益になっているかも計算で出しました。なお、プライズストラクチャーは以下のものを利用しました
http://sur.pokeramericas.net/help/tournaments/payout-structure.html

#データの分布
左から右へ高い順(要はランキング順)に並べたものがこちらになります。

ELOレーティング

elo.png

TrueSkill

見るとわかりますが、ELOよりグラフが全体的になだらかです。
かなり運の要素が含まれ絶対的な強弱が付けづらいポーカーにおいてはこちらの方が妥当な推定ではないでしょうか。
特にExposeされたレーティングはかなりなだらかな推定が出来ています。
mu.png
sigma.png
expose.png

それ以外の指標

参加回数はこんな感じです。後で述べる通りリピーターはそこまで多くない世界なんでしょうか。
ただし、名寄せが正確に出来ていない(やっていない)ため同一人物が別人とカウントされているケースが存在しています。
count.png

仮の収支は、収支プラスが青色、0が緑、収支マイナスを赤にしました。
profit.png

こちらはレーキ考慮
rake.png

見ていて面白かったのは、10%のレーキを取っても、マイナスがプラスに変化するのはわずか2%程度だという事実です。
その割にトップの収支は2/3くらいに変化していたりと。

収支 件数(レーキ無) 件数(レーキ有) 比率(レーキ無) 比率(レーキ有)
マイナス 32,650 33,698 77.2% 79.7%
±0 185 5 0.4% 0%
プラス 9,441 8,573 22.3% 20.3%

要約統計量

desc.PNG

いくつか言える事があります

  • 平均すると15.7回あたりリピートしているが、全体の半分は2回しか来ていない。
  • 実際に1回10,000ポイントを賭けて戦っていたらトップは667万ポイントプラス、ビリは1,200万ポイントのマイナス
  • レーキ10%による効果は、勝ち組をもっと勝たせ、負け組をもっと負けさせる効果が非常に強い。マイナスをプラスに変える力は薄い

相関関係

corr.png
corr_table.PNG

収支がレーキの有無によって出場回数との相関係数を大きく変えています。。。

そして今回TrueSkill>ELOレーティングであることを定量的に示せる根拠がこちらかと思います。
ポーカーにおける絶対的な実力評価尺度である、収支と相関関係が強いのは、TrueSkillであることが見て取れます。
しかし、強いといってもμが0.26程度、エクスポーズは0.21程度とそこまで強くありません。

少し考えてみると、収支は出場回数に依存する数値のため、収支を出場回数で割った、1試合あたりの期待値を列で追加してみます。

corr2.png
corr_table2.PNG

すると、こちらはμで0.4の相関係数、exposeで0.33の相関係数となり、μの0.4は弱い相関~やや相関がある境目の値程度まで改善しました。
いずれにせよELOは遠く及ばない値であり、TrueSkillの優位性が改めて浮き彫りになったと思います。

最後に

アウトプットの練習も含めて、自分が興味を持てるジャンルで色々と試した結果を残してみました。
もし内容に誤りがあったり、問題がある等のご指摘あればコメントかTwitterのDMでいただければ幸いです。

ポーカーってこんな全然関係無いような事をしていても超楽しいくらい人を魅了する素晴らしいゲームです!

6
7
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
7

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?