最近、インターネットでtoto・bigの当選確率に関する記事をみた。理論値で『勝・分・負』の出る確率が1/3で、計算されることが多い。本当に1/3になる?
##Jリーグのデータ
データ期間:1993年〜2015年
対象チーム:J1,J2,J3の全チーム
ルール:90分間内の結果(延長戦、PK戦の結果は引分とする)
ホーム | 全 | 勝 | 分 | 負 |
---|---|---|---|---|
回数 | 12,552 | 5,266 | 3,118 | 4,168 |
率 | - | 41.95% | 24.84% | 33.21% |
ホームが有利だと分かるが、引分が25%だと?えっ、1/3ではない?
##理論的に、引分の出る確率が1/3になるか?
###仮定
中立の場所で(ホーム要素なし)、実力(勝つ確率、得点数など)が全く同じである両チームの対戦
試合時間:90分間
両チームの得点数:0.5~2.5 goals/match(0.1刻みで設定する)
守備力:とりあえず考慮しない
分布:90分間内の得点数は、二項分布に従うとする。
シミュレーション:100万回の中で、引分の割合を見てみよう。
###結果
完全に対等な両チームであっても、引分の確率が1/3にならない。
goals prob_draw
[1,] 0.5 0.46632
[2,] 0.6 0.41768
[3,] 0.7 0.38492
[4,] 0.8 0.35270
[5,] 0.9 0.33012
[6,] 1.0 0.30564
[7,] 1.1 0.28890
[8,] 1.2 0.27644
[9,] 1.3 0.26416
[10,] 1.4 0.25263
[11,] 1.5 0.24364
[12,] 1.6 0.23508
[13,] 1.7 0.22820
[14,] 1.8 0.22292
[15,] 1.9 0.21470
[16,] 2.0 0.20891
[17,] 2.1 0.20319
[18,] 2.2 0.20047
[19,] 2.3 0.19346
[20,] 2.4 0.19193
[21,] 2.5 0.18550
##結論
toto・big確率計算で、『勝・分・負』を当確率で計算することをやめてくれ。
面白い結果だ。
ホーム要素などを考慮して、続けてやってみたい。
続き!
##コード
n <- 100000
t <- 90
goals <- seq(0.5,2.5,by = 0.1)
prob_draw <- rep(0, length.out = length(goals))
result <- cbind(goals,prob_draw)
Fun <- function(x){
home <- rbinom(n,size = t,prob = x["goals"]/t)
away <- rbinom(n,size = t,prob = x["goals"]/t)
length(which(home==away))/n
}
result[,2] <- apply(result,1,Fun)
result