3
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

文章題で身に付くプログラミング思考入門️ by TheWaggleAdvent Calendar 2024

Day 24

囚人のジレンマ (矛盾編 - ナッシュ均衡)|文章題で身に付くプログラミング思考入門️(24/25)

Last updated at Posted at 2024-12-25

はじめに

前回の続きです。
囚人のジレンマについてパレート最適を考えた時に湧いてきた疑問

「二人とも刑罰を受けることが、本当に一番良い選択肢だと言えるのだろうか?」

について、ナッシュ均衡の観点を紹介します。

『文章題で身に付くプログラミング思考入門️』は、日常や文章問題からプログラミング思考を身に付けていく、簡単で身近で、あなたをちょっと輝かせてくれるシリーズです。

これまでのまとめ

対象者

  • プログラミングの考え方を学びたい人
  • プログラミングに挫折したことのある人
  • 論理的思考を鍛えたい人
  • 文系の人
  • エンジニアの思考を理解したい人

振り返り

囚人のジレンマとは

2人の囚人が別々に隔離されて尋問を受けている。
両者が「協力(黙秘)」すれば、2人とも軽い刑罰。
一方が「裏切り(自白)」、もう一方が「協力(黙秘)」すると、裏切った囚人は釈放、黙秘した囚人は重い刑罰。
両者が「裏切り(自白)」なら、中程度の刑罰。

囚人のジレンマのパレート最適(全体最適)

お互いを信じ、両者とも協力(黙秘)して、軽い刑罰を受けること

パレート最適とは

  • 他の誰かの利益を損なうことなく、誰かの状況を改善できない状態
  • 全員が得をする選択肢がこれ以上ない、全体として最適な状態

ナッシュ均衡とは

さて、本題です。

囚人のジレンマに戻って考えた時、全体のことを考えたら確かに黙秘するのが一番点数が良かったわけですが、囚人本人にとってみれば刑罰を受けない選択肢が他にあるわけですから、そりゃあ釈放された方が嬉しいですよね。

大事な前提として、囚人のジレンマでは、各プレーヤーが自分の利益を最大化する行動を取ります。

これがナッシュ均衡です。

ナッシュ均衡とは、ゲームのプレイヤー全員が自分の行動を最適化した状態を指します。
自分が他の選択肢を選んだとしても、全員が現状より良くなる選択肢がない状態です。

囚人は、「協力(黙秘)」か「裏切り(自白)」のどちらかを選択することができます。

それぞれの選択肢によってどのような点数を得られるのか、表にしてみましょう。

自分が\相手が 相手が協力(黙秘) 相手が裏切り(自白)
協力(黙秘) 軽い刑罰 3点 重い刑罰 0点
裏切り(自白) 釈放 5点 中程度の刑罰 1点

つまり、

  • 自分が協力すると
    • 相手が裏切った場合に 0点(最大の損) を受けるリスクがある
  • 自分が裏切ると
    • 相手が協力した場合に 5点(最大の利益) を得られるし、相手が裏切っても 1点(軽い損) を得る

というところで、裏切る選択肢を取る方が合理的なわけです。

相手も、自分と同じように、本人にとって最も合理的な選択肢をとってくることがわかっているわけですから、相手も裏切ってくるでしょう。

結論として、

  • 自分も相手も「裏切る」選択をすることで、中程度の刑罰(1点) に落ち着く
  • どちらも戦略を変える理由がなくなる
    • 「協力する」選択をしたところで相手は「裏切る」のが合理的なので裏切ってくる。であれば、自分にとって「協力する」理由がない

このように、自分が他の選択肢を選んだとしても、全員が現状より良くなる選択肢がない状態がナッシュ均衡です。

囚人のジレンマの場合は、個人の合理性が全体の非合理性を引き起こします。

こうして見てみると、自分にとっては裏切りが合理的です。
一方、相手にとっても点数の条件は一緒なので、相手にとっても裏切りが合理的な選択肢です。

要するに、両者とも裏切り(自白)を選ぶことが、ナッシュ均衡です。

囚人のジレンマからわかること

繰り返す囚人のジレンマで、どのような戦略が強かったかをこちらの記事から思い出してみましょう。

しっぺ返し(Tit-for-Tat) が一番強かったそうです。

  • まずは友好的関係を構築する
  • 相手が裏切ってきたら、こちらも許さないという態度をはっきりとる
  • 相手が歩み寄ってきたら、こちらも歩み寄る。根に持たない

つまり、状況に応じて柔軟に対応できる方が強かったわけです。

ここからわかるのは、信頼とコミュニケーションの重要性です。

まとめ

囚人のジレンマで全員が生き残るには、お互いに相手が裏切らないという信頼関係が必要です。
そして、そもそもこれは、繰り返されることが前提とされたコミュニケーションなのです。

たった一回だけの相手ならば、裏切った方がお得なわけです。
ですが、現実の人間関係は、コミュニケーションの繰り返しによって生まれます。

まずは友好的に歩み寄る。
一度うまくいかなくても、許し、許され、関係性を作っていこうとする前向きさが、お互いの利益を生むのです。

そして何より、適応するものが生き残るのです。
そのために、柔軟であろうとしましょう。

これが、囚人のジレンマからわかる、大切なことです。

最後に

ここまで読んでくださってありがとうございます!
よかったら「いいね」をください。続ける励みになります!

3
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?