ゲーム理論とは
ゲーム理論(ゲームりろん、英: game theory)とは、経済や社会における複数主体が関わる意思決定の問題や行動の相互依存的状況を数学的なモデルを用いて研究する学問である。
wikipediaからの引用です。
ゲーム理論では、
例えば「じゃんけんゲーム」のようなゲームを、
数学的なモデルに落とし込んで、
ゲームの均衡点を模索して行くことがキモのようです。
以下、上記の本に出てくる専門単語をまとめてみました。
なるべく本の流れに沿って、言葉をまとめました。
Part1 ゲーム理論と経済学
-
ゲーム理論
経済や社会における複数主体が関わる意思決定の問題や
行動の相互依存的状況を数学的なモデルを用いて研究する学問
以下の2種類に分かれる。- 協力ゲーム理論
複数のプレイヤーが拘束力のある合意を結ぶ状況を扱う協力ゲーム理論 - 非協力ゲーム理論
個々のプレイヤーが独立に行動する状況を扱う非協力ゲーム理論
この本では、主に非協力ゲーム理論を扱う。
- 協力ゲーム理論
-
効用
主体的評価の尺度
人により異なる。満足度。- 期待効用(フォン・ノイマン=モルゲンシュテン効用)
- 通常の期待値計算のように
効用に従って計算された期待値のこと。 - また、各賞金の効用のこと。
- 通常の期待値計算のように
- 期待効用関数(フォン・ノイマン=モルゲンシュテン効用関数)
期待効用関数の期待値を表す関数 - 期待効用仮説
プレイヤーは期待効用が最大となる行動を取る、
という行動仮説。
- 期待効用(フォン・ノイマン=モルゲンシュテン効用)
Part2 ゲーム理論の基礎
戦略型のゲーム
定式化するのに
- プレイヤー
- 戦略
- 利得
の3要素が必要となる。 - プレイヤー $N$人
実際に行動する人や組織 - 戦略
相手の行動を予測して、
今後どのような行動を取っていくかの表。
第$i$プレイヤーがとりうる戦略を$S^i$と表し、
第$i$プレイヤーの任意の戦略を$s_i$と表す。
全てのプレイヤーの戦略の組み合わせは、以下の直積で表される。
$$S = S^1 \times S^2 \times \cdot\cdot\cdot \times S^n $$ - 利得
各プレイヤーの利益。
行列のような形で表される。
他のプレイヤーが戦略$s_1,s_2...s_n$をとった時の、
プレイヤー$i$の利得は、以下の関数で表される。
$$\pi_i(s_1, s_2, \cdot\cdot\cdot,s_n) $$
-
以上より、
- プレイヤーの集合
- 各プレイヤーがとりうる戦略の集合
- 利得関数
を並べたもので、
戦略型ゲーム$G_s$は以下のように表される。
$$ G_s = (N; S^1,S^2,\cdot\cdot\cdot,S^n;\pi_1,\pi_2,\cdot\cdot\cdot,\pi_n)$$
-
均衡点
非協力ゲームの最終的な到達点。
戦略の種類
- 支配戦略
自分にとって最善となる戦略。 - 純粋戦略
基本形となる戦略。 - 混合戦略
純粋戦略を、
さまざまな比率で混ぜ合わせた戦略。
例えば、「確率論的解釈」により
1/2でグーを、1/2でパーを出すような戦略。
純粋戦略しか存在しないゲームに、
混合戦略を導入することで、
ナッシュ均衡が存在しないゲームに、
ナッシュ均衡が存在する可能性が生まれる。
最適反応
- 自分以外のすべてのプレイヤーたちがとる戦略を所与としたときに
自分の利益を最大にするような戦略。
ナッシュ均衡
- どのプレイヤーにとっても、
他のプレイヤーたちが出している戦略を所与としたときに、
自分がそれに対する最適反応を行なっている状態。
ゲームの最終的な到達点。 - プレイヤー$i$がコントロールできる戦略(変数)を$s_i$、
プレイヤー$i$がコントロールできない戦略(変数)を$s_{-i}$ とする。
また、上記の文字を用いた利得関数の書き方を
$$\pi_i(s_i; s_{-i}) $$
とすると、どのような$s_i$に対しても以下が成り立つような
$\tilde{s_i}$ を「プレイヤー$i$ の最適反応」という。
$$\pi_i(\tilde{s_i}; s_{-i}) \geq \pi_i(s_i; s_{-i}) $$
ナッシュ均衡であるとは、どのプレイヤー$i$についても
$\hat{s_i}$ が $\hat{s_{-i}}$ に対して、
最適反応になっている場合をいう。
競争均衡と不動点定理
競争均衡と不動点定理が存在することは同値
- 不動点とは関数$y = f(x)$ について
$x^* = f(x^* )$ となるような
点 $(x^* , x^* )$ のこと
ブラウアーの不動点定理(1変数版)
- 定義域が閉区間 $[0, 1]$ で
- 値域も同じ閉区間に含まれる
- 連続関数
は必ず不動点を持つ。
ブラウアーの不動点定理(多変数版)
$X$をあるベクトルの集合とする。
集合$X$が凸集合で、かつ有界閉集合であれば
- 集合$X$を定義域とし、
- 値域も同じ集合$X$に含まれる
- 連続関数
は必ず不動点を持つ。
展開型ゲーム
- 順番に展開されていることが分かるようなゲーム
戦略型ゲームとの違いに、
「情報集合」という概念がある
情報集合
ゲームの木の上で、情報構造を視覚的に表現する手段。
ゲームの木のいくつかの手番を円で囲んで表される。
完全記憶、非完全記憶
- 今までの自分の手が分かるのが「完全記憶」
- 分からないのが「非完全記憶」
Part3 ナッシュ均衡の絞り込み
ナッシュ均衡の種類
以下の順番に絞り込んでいく
下に行くほど安定な均衡
- 部分ゲーム完全均衡
どの部分ゲームにおいても、期待利得を最大化している - 逐次均衡
各情報集合において、戦略が期待利得を最大化している - 完全均衡
プレイヤーが誤った行動を選択する微少な可能性に対して、安定なナッシュ均衡。
微小な可能性に対して、極限をとって求める。
Part4 ゲーム理論の展開
非完備情報ゲームとベイジアン均衡
-
完備情報ゲーム、非完備情報ゲーム
プレイヤーがルールを熟知して入れば、完備情報ゲーム
していなければ非完備情報ゲーム -
現在価値
時間経過による割引を考慮に入れて得られた、
現在においての価値
感想、その他
この記事は、あんまりゲーム理論に関する記事を見つけられなかったので投稿してみました。
Markdown記法にあまり慣れていないんですが
ちょっとレイアウト凝ろうと思ったら、htmlだと思ってやった方が良いんですかね。
Qiitaに記事を投稿してみたかったのでその練習用の記事になってます。
気が向いたら画像やリンクを貼って、各種概念をわかりやすくまとめなおそうと思います。
自分で見直してもひどい部分がありますが、とりあえず練習ということで公開してみます。