はじめに
20 年以上前、 fj.sci.math というニュースグループに、グリコゲームをネタにしたゲーム理論の記事を投稿したことがありました。面白い題材なので Qiita の記事にまとめなおしたいと思います。
「グリコゲーム」というのは、ジャンケンをして勝ったら勝った手に応じた歩数を進んで、先にゴールできた方が勝ち、というあの遊びです。
グリコゲームのルール
2 人でジャンケンをして勝ったら、勝った手の種類で以下の数だけ進むことができます。
グー :グ,リ,コ(3 歩)
チョキ:チョ,コ,レ,イ,ト(5 歩)
パー :パ,イ,ナ,ッ,プ,ル(6 歩)
ジャンケンを繰り返して、先にゴールした方が勝ちです。
チョキについては、「チ,ヨ,コ,レ,イ,ト」で 6 歩とするルールもありますが、ここでは 5 歩のルールを採用します。
ゲーム理論で考える
2 人でグリコゲームを戦うときに最適な手の出し方について、
ゲーム理論の「 2 プレイヤーゼロ和ゲーム」として考えます。
a 君と b 君とが十分長い距離をグリコゲームでじゃんけんをしながら進みます。
1 回のじゃんけんで勝ったときの歩数を利得と考えると a 君の利得表は以下のようになります。
a 君 \ b君 | グー | チョキ | パー |
---|---|---|---|
グー | 0 | 3 | -6 |
チョキ | -3 | 0 | 5 |
パー | 6 | -5 | 0 |
a 君の混合戦略のグー/チョキ/パーの確率を $ G, C, P $ 、
b 君の混合戦略のグー/チョキ/パーの確率を $ g, c, p $ とすれば、
このゼロ和ゲームの a君の期待利得は以下の式になります。
G(3c-6p)+C(-3g+5p)+P(6g-5c) = 0
これに $ P=1-(G+C), p=1-(g+c) $ を代入して整理すると、
(14G-5)c+(-14C+6)g-6G+5C = 0
これが、相手のあらゆる混合戦略に対して成り立つから、
\begin{align}
14G-5=0 \\
-14C+6=0 \\
-6G+5C=0 \\
\end{align}
これらを解いて、
\begin{align}
G = \frac{5}{14} \\
C = \frac{6}{14} \\
P = \frac{3}{14} \\
\end{align}
というわけで、グー : チョキ : パーを $ 5:6:3 $ の割合で出すのが
最も負けない混合戦略となります。
3すくみ構造における一般化
3すくみ構造の場合、それぞれの戦略で勝った場合の利得を
$ x,y,z $ とすれば、最適な混合戦略は $ y:z:x $ の比になるようです。
ちょっと計算。
プレイヤー 1 の混合戦略の確率を $ A, B, C $ 、
プレイヤー 2 の混合戦略の確率を $ a, b, c $ として
それぞれの戦略で勝った場合のプレイヤー 1 の利得を
$ x, y, z $ とすれば
【利得表】
1 \ 2 | $ a $ | $ b $ | $ c $ |
---|---|---|---|
$ A $ | $ 0 $ | $ x $ | $ -z $ |
$ B $ | $ -x $ | $ 0 $ | $ y $ |
$ C $ | $ z $ | $ -y $ | $ 0 $ |
A(bx-cz)+B(-ax+cy)+C(az-by) = 0
$ C=1-(A+B), c=1-(a+b) $ を代入して整理して、
(A(x+y+z)-y)b - (B(x+y+z)-z)a - Az+By = 0
これが全ての $ a, b $ について成り立つから、
\begin{align}
A=\frac{y}{x+y+z} \\
B=\frac{z}{x+y+z} \\
C=\frac{x}{x+y+z} \\
\end{align}
というわけで、それぞれ $ x, y, z $ の利得が得られるジャンケンで
最適な混合戦略の比率は $ y : z : x $ となります。