0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

圏論はゲーム理論を書き換える(Compositional Game Theory 入門)──ゲームを部品から組み立てる合成的世界へ:AI・マルチエージェント時代の新しい風景

0
Last updated at Posted at 2026-06-07

thumbnail_picture.jpg

この記事は、架空の大学「圏峰(けんぽう)工科大学」の研究室を舞台にした、ひとつの対話篇です。

登場するのは、ゲーム理論にも経済学にも触れたことがない学部生と、圏論・経済学の応用を専門とする若手専任講師のふたり。

人物や大学はフィクションですが、扱う中身(理論・論文・応用)は、すべて実在する研究にもとづいています。出典は記事末にまとめました。

想定読者は、高校の数学はだいぶ忘れたけれど、毎日 Python のコードを読み書きしているエンジニア・データサイエンティスト・機械学習エンジニア・AI リサーチャーの皆様で、既存のゲーム理論をまったく学んだことがない方々です。

むずかしい言葉は、初めて出てくるところでかみくだいて説明します。数式が出てきても、読み飛ばして大丈夫なように書きました。


TL;DR ── この記事で分かること(お急ぎの方へ)

Compositional Game Theory(合成的ゲーム理論) は、「大きなゲームを、小さな部品から組み立てる」という発想で、ゲーム理論を圏論の言葉で書き直す、近年の研究領域です。

普通のゲーム理論(Nash, Selten, Harsanyi らの古典)は、「ひとつのゲーム」を一塊として扱ってきました。

これに対して、合成的ゲーム理論は、ゲームを、「選択 + 観察 + 文脈」というプラグの組み合わせとして捉え、プラグ同士を接続することで、大きな経済モデルを組み立てることを可能にします。

pic_1.jpg

中心人物は Jules Hedgesです。

Hedges氏は、スコットランドのグラスゴーを拠点とする研究者で、現在は自ら共同設立した Institute for Categorical Cybernetics (CyberCat Institute)を中心に活動しています (2024年時点では University of Strathclyde を兼任)。

このHedges氏が、2017年の博士論文で提唱した Open Games(開かれたゲーム)という概念が、合成的ゲーム理論の出発点です。

何が新しいか:

  • 大規模なゲーム(オークション、市場、規制、AIエージェントの相互作用)を、レゴブロックのように組み立てられる
     
  • Nash 均衡が、圏論的な不動点として再定義される
     
  • メカニズムデザイン(オークション設計、入札制度、規制設計)を、合成可能な部品として扱える
     
  • AI 安全性、マルチエージェント強化学習、スマートコントラクトへの応用が、進みつつある
     
    Python のコードで実際に動かす実装も、すでに存在します(Haskell の open-games ライブラリ、その他)。

🔑 この記事の本質を、一文で言うと:

ソフトウェア工学が「巨大プログラムをモジュール化する技術」だったように、Compositional Game Theory は「巨大な戦略システムをモジュール化する技術」と見ることもできます。

pic_2.jpg

上図:ソフトウェア工学と合成的ゲーム理論の対比

「モノリシック(monolithic)」 とは、全体が一枚岩のように分かれておらず、ひとつの大きなかたまりになっている状態のことです。

かつての巨大プログラム が、関数・クラス・モジュール・マイクロサービスといった 部品に分解されて扱いやすくなった ように(図の左半分)、伝統的なゲーム理論の「一枚岩のゲーム」 も、開かれたゲーム・プラグ化された戦略・合成的な均衡といった部品へと分解することが可能となります(画像の右半分)。

どちらも、「大きなものを、小さな部品から組み立てる」という同じ精神を共有しています。


この記事の目的は、ゲーム理論を初めて学ぶ Python プログラマが、「なぜゲーム理論を圏論で書き直すと嬉しいのか」を腑に落とすことです。

以下、対話形式で、その仕組みと意味を、ゆっくりほどいていきます。


序章 ── 「ゲームを部品から組み立てる」って、具体的にどういうこと?

pic_4.jpg

学部生:
先生、いきなり核心からなんですが ──「ゲームを部品から組み立てる」って、具体的に何をどうするんですか?

そもそもですが、「ゲーム理論」 って、私は名前しか聞いたことないんです。

チェスとか将棋とか、ゲームの戦略を数学的にひも解いて分析する分野、くらいの理解で。
何度か専門書を手に取って開いたことがありますが、難しそうな数式が並んでいて、面食らいました。

講師:
一般的なイメージは、そんな感じかもしれないね。

ゲームの種類を性質や問題設定ごとに細かく分類するために、専門用語が出てきたり、一見すると難しそうな数式が印字されているのを見て、とっつきにくさを感じて、本やウェブサイトを閉じてしまった人も多いと思う。

でもね、実は、ゲーム理論の「ゲーム」は、チェスや将棋だけじゃないんだ。

経済学・経営学・政治学・生物学・人工知能 ── これら全ての分野で、「複数のプレイヤーが、それぞれ戦略を選び、結果が決まる」状況を扱う数学的な道具が、ゲーム理論なんだ。

pic_3.jpg

学部生:
それは、例えば?

講師:
具体例だらけだよ。
 

  • 企業$A$ と企業$B$ が、価格をどう決めるか(寡占市場)
     
  • オークションで、入札者がいくらで札を入れるか(オークション設計)
     
  • 国$X$ と国$Y$ が、軍備を増やすか、減らすか(国際関係)
     
  • 自動運転車が、他の車との衝突を避けるためにどう動くか(マルチエージェント AI)
     
  • 広告主と検索エンジンの、広告枠の取り引き(Google の検索広告は、毎秒何百万回ものゲームが進行している)
     
  • 株式市場での、買い手と売り手の戦略(高頻度取引)
     
  • 生物の進化における、捕食者と被食者の戦略(進化的安定戦略、ESS)

これら全て、ゲーム理論で扱える。

学部生:
そんなに広いんですね。

講師:
そうなんだ。

広告オークションや高頻度取引などもあるんだ

その話は、この記事でも応用例として取り上げるよ。

学部生:

経済学、経営学、政治学、生物学、人工知能に加えて、広告オークションと高頻度取引……。

へえ。ゲーム理論って、難しそうで縁遠い存在だと思っていましたが、僕らの日常生活にずいぶん近い存在なんですね。

2つ、疑問が湧いてきました。

1つ目は —— 強化学習や、深層ニューラルネットワークで強化学習タスクを解く深層強化学習が、ロボットの制御や、LLM の回答精度の向上、リコメンドエンジンに採用されているのは有名です。

では、ゲーム理論や、いま大学で履修しているオペレーションズ・リサーチは、産業界で実際に使われているんですか?

それとも、一部の大学研究者が論文を書くためだけに研究している、実業界からはあまり見向きされない「象牙の塔」の分野なんでしょうか?

2つ目は —— これらの応用分野にゲーム理論を適用したとき、従来のゲーム理論と、圏論を取り込んだ合成的ゲーム理論とで、応用範囲はどれくらい変わるんですか

今の段階で、まずこの2つを、全体像をおさえるために先に知っておきたいんです。

講師:
いい問いだ。全体像をおさえるのに、ちょうどいい2つだと思う。

順に答えよう。

まずは、1つ目の質問から。 ──実業界で本当に使われているのか、それとも象牙の塔か?

結論から言うと、ゲーム理論もオペレーションズ・リサーチ(OR)も、産業界でバリバリ使われている

むしろ OR は、君が思っている以上に「現場の道具」だ。

たとえば宅配大手の UPSは、配送ルートを最適化する ORION というシステムを、OR と機械学習で構築した。

約10億ドルを投じ、全米5万台超のトラックに展開して、年間およそ1億マイルの走行と、3〜4億ドルのコストを削っている。

ほかにも、航空会社の乗務員スケジューリング、工場の生産計画、在庫管理、収益管理(ダイナミックプライシング)── ORは、こうした「大規模で、最適化が効く意思決定」の屋台骨だ。

決して、論文のための学問じゃない。

ゲーム理論も同じく実用されている。ただし、使われ方に少し色がある。
 

  • オークション設計:
    アメリカの電波(周波数)オークションは、ゲーム理論家の Paul Milgrom と Robert Wilson らの設計が土台で、二人はこの業績で2020年にノーベル経済学賞を受けた。Google の検索広告のようなオンライン広告オークションも、ゲーム理論(セカンドプライス型)の応用だ。
     
  • マッチング:
    Alvin Roth は、臓器のドナー提供者と、臓器提供を必要としている患者を組み合わせる腎臓のドナー・マッチングの仕組みをゲーム理論とマッチング理論で設計し、実際の移植件数を増やした(2012年ノーベル経済学賞)。
    研修医の配属や学校選択にも、同じ理論が使われている。
     
  • セキュリティ:
    空港や港湾で、巡回・検査の配置を「相手の裏をかくゲーム」として最適化するセキュリティ・ゲームも、実運用されている。
     
    ただ、正直なところも言っておく。

ゲーム理論は、制度やルールを「設計」する道具としては非常に強い(オークションやマッチングがまさにそれだ)。

その一方で、入り組んだ現実の駆け引きの結果を 「予測」する道具 としては、前提を単純化しすぎるという批判も根強い。

だから、万能の予言機ではない。

設計に強く、予測には慎重に、というのが現場感覚に近い。

次に、2つ目の質問だ。

── 従来のゲーム理論と、合成的ゲーム理論とで、応用範囲はどれくらい変わるのかどうか。

応用できる「分野」そのものは、ほとんど同じだ。

オークション、市場、規制、マルチエージェント AI
── 合成的ゲーム理論 も、その応用先は、伝統的なゲーム理論 と重なっている。

違いが出てくるのは、「ゲーム理論のモデル(経済モデル・戦略モデル)の作り方」のほうだ。

さっきのモノリシックの図を思い出してくれ。

伝統的なゲーム理論が、「一枚岩のゲームを、毎回ゼロから書き下ろす」 のに対して、合成的ゲーム理論は、「部品(プラグ)を組み合わせて大きなモデルを組み立て、一部を差し替えても全体を作り直さなくていい」。

つまり、応用の「範囲」を広げるというより、大規模なモデルを「扱いやすく・保守しやすく」する 改良だと思っておくといい。

そしてもう一つ正直に言うと、合成的ゲーム理論は、まだ研究段階だ。

いまこの瞬間、実業界で動いているのは、ほとんどが伝統的なゲーム理論とORなんだ。

合成的ゲーム理論が「作り方」を変えた先に、どんな新しい応用が開けるか ── それは、これから10年〜20年かけて見えてくる話だ

それと、いまオペレーションズ・リサーチ(OR) の話が出たね。

ORは、それ自体が大きなテーマ だ。

今日は深入りしないが、稿を改めて、別の機会に、この対話篇でじっくり議論しよう

線形計画、組合せ最適化、待ち行列、在庫管理 ── どれも、エンジニアの実務に直結する話題 だからね。

ただ、一つだけ「予告編」 を言っておくと ── OR と圏論にも、ちゃんと接続がある

近年の 応用圏論 では、最適化問題そのものを「部品から組み立てる」研究 が進んでいる。

鍵になるのは、ハイパーグラフ圏(hypergraph category)装飾コスパン(decorated cospan) と呼ばれる道具立てだ。

これらを使うと、電気回路や力学系と同じように、最適化問題を「入力と出力を持つ開いた部品(open objective)」として表し、それらを配線図のようにつないで、大きな最適化問題を組み立てられる

さらに面白いことに、その枠組みでは、勾配降下法(gradient descent)が、部品の合成と整合する「関手(functor)」として定式化できる ことも示されている。

各部品を最適化して、それを合成すると、全体の最適化になる
── これは、今日ずっと話してきた合成的ゲーム理論の「プラグを組み立てる」発想と、まったく同じ精神なんだ。

学部生:

ゲーム理論だけじゃなくて、最適化そのものまで「部品から組み立てる」流れがあるんですね!

講師:

そうなんだよ。

「大きなものを、小さな部品から、配線図のように組み立てる」── 応用圏論という大きな地形の上では、ゲーム理論も、最適化も、機械学習も、同じ言葉で語られはじめている

だからこそ、ORの話も、いずれこの対話篇で扱う価値がある。

ただ、これも、合成的ゲーム理論と同じく、まだ研究段階の話だ。
今日のところは「そういう地平がある」とだけ覚えておいてくれ。

学部生:
分かりました。

ORは、また別の機会に。
今回は、ゲーム理論と圏論が出会って開けてくる「合成的ゲーム理論」に集中したいと思います。

でも、兄貴にもこの話題をふってみたいので ── ORと圏論の融合領域について、代表的な、epoch making な「読むべき論文」を、いくつか教えてくださりませんか?

講師:
いい心がけだ。
お兄さんと議論するのなら、なおさら出典がはっきりしている方がいい。

ただ、先に正直に言っておく。

「OR × 圏論」は、まだ非常に若い領域だ。

ゲーム理論における Nash 1950 のような、誰もが認める歴史的金字塔が、この交差点にすでにある、とまでは言えない。

だから、これから挙げるのは「金字塔」というより、この分野の入口と土台になっている代表的な論文だと思って受け取ってくれ。

入口(まず全体像をつかむ教科書)

  • Brendan Fong & David I. Spivak, An Invitation to Applied Category Theory: Seven Sketches in Compositionality (Cambridge University Press, 2019 / arXiv:1803.05316)

応用圏論全体の入門書。

電気回路やネットワークを「部品から組み立てる」話が、最小限の前提で読める。OR の話に入る前の地ならしに最適。

土台(「開いたシステム」を合成する)

  • John C. Baez & Brendan Fong, A Compositional Framework for Passive Linear Networks (Theory and Applications of Categories 33, 2018 / arXiv:1504.05625)

電気回路を「入力と出力を持つ部品」として圏で表し、内部構造を忘れて外部の振る舞いだけを残す「ブラックボックス関手」を定式化した論文。

後続の「最適化を部品から組み立てる」研究の、発想の源流のひとつ。

最適化問題そのものの合成

  • Tyler Hanks, Matthew Klawonn, Matthew Hale, Evan Patterson, James Fairbanks, A Compositional Framework for First-Order Optimization (arXiv:2403.05711, 2024)

これはお兄様に一番刺さるはずだ。

最適化問題そのものをオペラッド(operad)で階層的に合成し、勾配降下法や Uzawa 法といった解法を「代数射(algebra morphism)」として導く。

論文の中で**最小費用流問題(minimum cost network flow)**を例にとり、分散的な分解アルゴリズムを自動生成してみせている。

OR の古典的問題が、ちゃんと圏論の俎上に載っている例だ。

Julia パッケージ AlgebraicOptimization.jl として実装も公開されている。

設計最適化(co-design)

  • Andrea Censi, Uncertainty in Monotone Co-Design Problems (arXiv:1609.03103, 2017)

ロボットなどの設計を、「機能・資源・コストの単調な関係」を持つ部品の合成として捉え、最適な設計を求める枠組み。

エンジニアリングの設計最適化に圏論を持ち込んだ代表例だ。

Gioele Zardini の博士論文(ETH Zürich, 2023)が、これを自動運転やモビリティ・システムへと具体的に展開している。

隣接領域(最適化 × 学習)

  • Brendan Fong, David Spivak, Rémy Tuyéras, Backprop as Functor: A Compositional Perspective on Supervised Learning (LICS 2019 / arXiv:1711.10455)

勾配ベースの学習 ── これも最適化の一種だ ── を関手として定式化した、圏論的機械学習の出発点的な論文。

OR と機械学習が「最適化」という共通項で圏論的につながることが見えてくる。

学部生:

ありがとうございます! これだけあれば、兄貴と話せそうです。

講師:

うん。

どれも arXiv で無料で読める。

ただ、繰り返すが、この交差点はまだ地図が描かれつつある段階だ。

「確立された研究領域」としてではなく、「研究の最前線」として読むのが、ちょうどいい。

学部生:
なるほど。

「すでに広く使われているのは、伝統的なゲーム理論とORで、合成的ゲーム理論は、その"作り方"を変えようとしている新しい挑戦」── そういう地図なんですね。

pic_5.jpg

ちなみに、その"伝統的なゲーム理論"って、そもそもどこから始まったんですか?

講師:
ゲーム理論は、20世紀半ばに John von Neumann と Oskar Morgenstern(1944年の『Theory of Games and Economic Behavior』)が体系化して以来、現代の経済学・社会科学・AIの中核言語の一つになっている。

John Nash(1950年代、Nash 均衡)、Reinhard Selten(部分ゲーム完全均衡)、John Harsanyi(不完備情報ゲーム)が、1994年にノーベル経済学賞を受賞している。

その後も、Roger Myerson, Eric Maskin, Leonid Hurwicz(2007年、メカニズムデザイン)、Alvin Roth, Lloyd Shapley(2012年、マッチング理論)── ノーベル経済学賞の常連分野なんだ。

学部生:
ノーベル賞の常連、ですか。

講師:
ところが、ここからが今日の本題だ。

伝統的なゲーム理論には、ある構造的な限界があるんだ。

学部生:
限界、と言いますと?

講師:
伝統的なゲーム理論は、「ゲーム」を、一つの完成した塊として扱ってきた

例えば、企業 A と企業 B が価格を競争するゲームを考えるとき、伝統的なアプローチでは、

  • プレイヤーのリスト
  • 各プレイヤーの戦略の集合
  • それぞれの戦略の組み合わせに対する利得(payoff)

これらを一度にすべて書き下ろす
そして、その全体の中で、Nash均衡などを計算する。

学部生:
それで何が困るんですか?

講師:
小さなゲームなら、それで困らない。

でも、現実の経済システムを考えてみてくれ。

  • 何百万社の企業
  • 何億人の消費者
  • 政府の規制
  • 金融市場
  • 国際貿易
  • 環境への影響

これら全てを、一つの巨大なゲームとして書き下ろせると思うかい?

学部生:
無理です。複雑すぎる。

pic_6_rev.jpg

講師:
そう。だから、伝統的なゲーム理論では、それぞれの場面ごとに、別々の小さなモデルを作って、それぞれを分析してきた。

「企業 $A$ と企業 $B$ の競争モデル」
「オークションのモデル」
「規制のモデル」

── 個別バラバラに。

ところが、現実は、これらが全てつながっている
企業の競争は、オークションを通じて広告を買うことで関わるし、規制が両方を制約している。

伝統的なゲーム理論は、これらのモデルを「組み合わせる」のが苦手なんだ。

学部生:
モデルとモデルを、つなげられない。

pic_7.jpg

講師:
そこで登場するのが、今日の主役 ── Compositional Game Theory(合成的ゲーム理論) だ。

**「ゲームを、小さな部品(プラグ)から組み立てる」**という発想。
各プラグには、入力と出力があり、プラグ同士を接続することで、大きなゲームを組み立てられる

学部生:
プログラミングの関数合成みたいですね。小さな関数を組み合わせて、大きな処理を作る。

講師:
まさにそれだ。

pic_8.jpg

Python で result = h(g(f(x))) と書くように、ゲームも $game = h ∘ g ∘ f$ と書ける

各 $f$, $g$, $h$ は、「プレイヤーが選択し、観察し、結果を出力する」というゲームの部品だ。
これらを合成すると、より大きなゲームになる。

学部生:
それが、圏論と関係するんですか?

講師:
深く関係する。

圏論は、「部品を合成する」ことの数学だからだ。

部品(対象)と、合成のルール(射と合成演算)── これが、圏論の核心。

だから、ゲームを部品として扱おうとすると、自然に圏論の言葉が現れる。

pic_9.jpg

そして、これを最初に厳密化したのが、Jules Hedges の博士論文(2017年、Queen Mary University of London)だ。

学部生:
Jules Hedgesさん、最初に出てきたキーパーソンですね!

講師:
Hedges氏は、グラスゴーの University of StrathclydeMathematically Structured Programming(MSP)グループで研究を進めてきて、現在は自ら共同設立した Institute for Categorical Cybernetics(CyberCat Institute) を中心に活動している研究者だ。

この研究者が、Neil Ghani(同 Strathclyde)、Viktor Winschel(MannheimUniversity 経済学)、Philipp Zahn(St. Gallen University 経済学)らと共同で、Open Games(開かれたゲーム)という概念を体系化した。

論文としては、Neil Ghani, Jules Hedges, Viktor Winschel, Philipp Zahn (2018) "Compositional game theory." LICS 2018がある。

なお、LICSは、Logic in Computer Science という国際会議の名称だ。覚えておくといいよ。
計算機科学における論理学の最高峰国際会議だからね。

学部生:
LICS、聞いたことあります。
Coq とか型理論の論文が出る会議ですよね。

講師:
そう。

経済学の論文が、計算機科学の論理学の国際会議の論文査読を通過した。
── これが、Compositional Game Theory独特な立ち位置 を象徴している。

経済学と計算機科学と圏論論理学の、ちょうど交差点にある。

pic_10.jpg

学部生:

この Compositional Game Theory って、Hedges さんが一人で研究しているんですか?

講師:

いや、そうじゃない。

出発点こそ Hedges の博士論文だが、最初の本格的な論文(LICS 2018)からして、Neil Ghani・Viktor Winschel・Philipp Zahn との4人の共著だ。

その後も、Joe Bolt、Matteo Capucci、Bruno Gavranović、Jérémy Ledent、Fredrik Nordvall Forsberg といった研究者たちが、確率版・反復ゲーム版・圏論的サイバネティクスへの拡張などを次々に発表 している。

研究の拠点も一つじゃない。

Hedges らの CyberCat Institute
Strathclyde 大学の MSP グループ
応用寄りのグループ 20squares
さらに Oxford や St. Gallen の研究者たちが、ゆるやかにつながっている。

pic_11.jpg

学部生:

どのくらいの規模の分野なんですか?

講師:

正直に言えば、まだ小さな分野だ。

Compositional Game Theory そのものの論文を出している研究者は、世界でおそらく数十人規模。

ただ、これは、応用圏論(Applied Category Theory、ACT) という、もっと大きな研究コミュニティの一部 なんだ。

ACTは毎年国際会議を開いていて、2019年のオックスフォード大会では70本の論文が投稿され、およそ150人が参加した。

会議はその後も、Maryland、Strathclyde、Cambridge、MIT、そして2025年はUniversity of Florida と、毎年各地で続いている。

専用の査読付きオープンアクセス誌『Compositionality』 も、このコミュニティが運営している。

つまり、Compositional Game Theory は、「一人の天才の思いつき」ではなく、応用圏論という生きたコミュニティの中で、複数の研究グループが育てている、小さいが着実に伸びている領域 なんだ。

学部生:
面白いです。
じゃあ、その「Open Games」って、具体的にどんな構造なんですか?

講師:
よし、次の章で、その心臓部に降りていこう。


第1幕 ── 普通のゲーム理論を、まず確認

pic_12.png

上図:囚人のジレンマの利得行列。

各マスの数字は (プレイヤーAの利得, プレイヤーBの利得) を表し、数値が大きいほど望ましい。本文の「黙秘=協調」「自白=裏切り」に対応する。

両者が協調すれば (3,3) とお互いそこそこ良いが、相手が協調しているときは自分だけ裏切ると (5,0) でさらに得をするため、双方が裏切りへ流れ、結果は (1,1) に落ち着く
── これが Nash均衡 である。

学部生:
先生、本格的に Compositional Game Theory に入る前に、普通のゲーム理論って、何をするものなのか、軽く教えてもらえますか?

僕、本当に名前しか知らないんです。

講師:
もちろん。

5分で、最低限の輪郭だけ掴もう。

ゲーム理論の3要素:
 

  • 第一に、プレイヤー:意思決定する主体。人、企業、国、AIエージェント、何でもいい。
     
  • 第二に、戦略:各プレイヤーが取りうる選択肢。
     
  • 第三に、利得(payoff):戦略の組み合わせによって、各プレイヤーが得る結果(満足度、お金、勝ち負け、など)。
     

pic_13.jpg

学部生:
プレイヤー、戦略、利得。シンプルですね。

講師:
最も有名な例は、囚人のジレンマ だよ。

ある事件で、二人の容疑者が捕まったとする。警察は別々の部屋で取り調べを行う。各容疑者には、二つの選択肢がある:

  • 黙秘(協力)
  • 自白(裏切り)

そして、結果はこうなる:

  • 両方が黙秘 → 各2年の刑
  • 両方が自白 → 各5年の刑
  • 片方が黙秘、もう片方が自白 → 黙秘した方は10年、自白した方は0年(司法取引)

学部生:
直感的には「両方黙秘」が一番マシですよね。

でも、相手が裏切るかもしれないと考えると…

講師:
そこが面白いところだ。

論理的に分析すると、両方とも「自白」を選ぶのが「合理的」 になる。

なぜなら、相手が黙秘でも自白でも、自分が自白した方が刑が軽くなるから (相手黙秘なら10年→0年、相手自白なら5年→5年)。

結果として、両方が自白して、各5年

本当は、両方黙秘で各2年が最善なのに、合理性が、最悪な結果を導く。

学部生:
合理性が、悲劇を生む。

pic_14.png

上図:囚人のジレンマ(刑の年数版)。

二人の容疑者は別々の部屋にいて、相手の選択は見えない。

各マスは (容疑者Aの刑, 容疑者Bの刑) で、ここでは数字が小さいほど良い(先ほどのスコア型の図とは数値の向きが逆)。

両方が黙秘すれば各2年で済む(緑)のに、相手がどちらを選んでも自分は自白した方が刑が軽くなるため、双方とも自白へ流れ、各5年(赤)に落ち着く

── これが Nash均衡であり、合理性が最善ではなく悲劇を導く。

講師:
この「両方自白」の状態を、Nash 均衡と呼ぶ。

Nash 均衡の定義:
他のプレイヤーの戦略が固定された状態で、自分だけ戦略を変えても、利得が改善しない状態。

囚人のジレンマでは、相手が自白を選んでいる時、自分が黙秘に変えると、刑が $5年→10年$ に悪化する。
だから、自白から動けない。これが Nash均衡だ。

学部生:
動けない状態ですか。

講師:
そう。

John Nash がプリンストン大学の22歳の博士論文(1950年)で証明したのは、「任意の有限ゲームには、(混合戦略の) Nash均衡が必ず存在する」という定理だった。

これにより、彼は、1994年にノーベル経済学賞を受賞 した。

映画『A Beautiful Mind』(2001年、ラッセル・クロウ主演)で、Nash の人生は広く知られるようになった。

学部生:
映画、見たことあります。あの先生の論文の話だったんですね。

講師:
そうなんだ。

ゲーム理論の伝統的な分析方法は、こうだ:

  1. プレイヤー、戦略、利得を全て書き下ろす
  2. Nash 均衡を計算する
  3. その均衡を、現実の経済・社会の振る舞いの予測として使う

pic_15.jpg

学部生:
シンプルですね。

講師:
シンプルだ。けれども、現実の経済システムは、プレイヤーも戦略も利得も、巨大になる。それを一つの大きな表に書き下ろすのは、現実的でない。

そして、異なるゲーム同士を組み合わせる(オークション + 規制 + 市場競争)場合、伝統的なアプローチでは、毎回ゼロから書き直す必要がある。

これが、伝統的ゲーム理論の限界 だ。

学部生:
そこで、Compositional Game Theory が登場する、と。

講師:
そうだ。次の章で、その心臓部を見ていこう。

pic_16.jpg


第2幕 ── Open Games:ゲームを「プラグ」として扱う

pic_17.png

学部生:
Open Games、それは具体的にどんな構造ですか?

講師:
鍵となる発想は、こうだ。

ゲームを「閉じた完成品」ではなく、「開かれた部品(プラグ)」として扱う

各 Open Game には、4つの入出力がある:

  • X:プレイヤーが観察する情報(入力)
  • Y:プレイヤーが選択する行動(出力)
  • R:行動の結果(入力、下流から来る)
  • S:結果に対する評価(出力、上流に返す)

学部生:
ちょっと整理させてください。プレイヤーは ──

  • 何かを見る(X、観察情報)
  • 何かを選ぶ(Y、行動)
  • その選択の結果が起きる(R、下流から)
  • その結果を評価する(S、上流に伝える)

ということですね。

講師:
完璧だ。

そして、この4つの入出力を持つ箱が、プラグとして機能する。

$Open Game ⊂ (X, Y, R, S)$

の形で書ける。

各プラグは、X と R を受け取り、Y と S を出す

プラグ同士を、矢印で接続する ことで、大きなゲームを組み立てられる

学部生:
プラグ同士の接続 って、具体的にはどう書くんですか?

講師:
2つの基本操作 がある。

操作1: 逐次合成(Sequential composition)

プラグ A の出力を、プラグ B の入力につなぐ。

$A(X, Y, R, S) → B(X', Y', R', S')$

ここで、$A$ の $Y$ が $B$ の $X'$ に、$B$ の $R'$ が $A$ の $R$ になる。

これは、「プレイヤー $A$ が動いた後、プレイヤー $B$ が動く」という順序関係を表す。

pic_18.jpg

操作2: 並列合成(Parallel composition)

プラグ $A$ とプラグ $B$ を、横に並べる

$A(X1, Y1, R1, S1) ⊗ B(X2, Y2, R2, S2)$

これは、「プレイヤー $A$ とプレイヤー $B$ が、同時に独立に動く」という並列関係を表す。

学部生:
直列の合成並列の合成
プログラミングのパイプとフォークみたい ですね。

pic_19.jpg

講師:
まさにそれだ。

そして、この二つの操作の上に、圏論の言葉モノイダル圏(monoidal category)の構造が乗る。

前回の対話「QNLP 入門」で見た、「縦につなぐ・横に並べる」の世界だ。

学部生:

そのモノイダル圏ですが、前回の先生との対話(先述の Qiita 記事)をまだお読みになっていない読者の方々もおられると思うので、もう一度、わかりやすく、簡潔に教えてください。

講師:

もちろん。

一言で言えば、モノイダル圏とは「縦につなぐ」と「横に並べる」の2つの操作が両方そなわった世界のことだ。

ふつうの圏(category)には、「縦につなぐ」操作 ── つまり、ある部品の出力を次の部品の入力につなぐ「合成」── がある。

さっきの逐次合成が、まさにこれだ。

モノイダル圏は、これに加えて「横に並べる」操作 ── 二つの部品を、つながずに並置する「テンソル積(⊗)」── を持つ。

さっきの並列合成が、これにあたる。

この 「縦につなぐ・横に並べる」が両方そろっていて、しかも両者がきちんと整合する (どちらの順で組んでも同じ結果になる)── そういう構造を持つ世界を、モノイダル圏と呼ぶんだ。

文字どおりの数式を覚える必要はない。

「部品を、直列にも並列にもつないで組み立てられる世界」 ── そう捉えておけば十分だ。さっきの逐次合成と並列合成の図を思い出してくれれば、もうその世界に半分足を踏み入れている。

学部生
今、わかりやすく説明してくださりましたが、圏論の専門書を読むと、モノイダル圏 は、『テンソル積』が定義されていること、が肝になるんですね?

ちなみに、僕が理解できないことを覚悟で、本格的な数学書の定義で言うと、モノイダル圏 は、専門書ではどういう説明書きで登場してくるんですか?

講師:
鋭いね。その理解で、ほぼ正しい。

「テンソル積(⊗)が定義されていること」が肝
── ただ、正確には「テンソル積さえあればいい」のではなく、それに付随する道具と、それらが整合するための条件がセット になっている。

覚悟してくれたから、専門書での正式な定義を、そのまま挙げてみよう。
記号は読み飛ばして構わない。

モノイダル圏 $(\mathcal{C}, \otimes, I)$ とは、次のものからなる:

  • 圏 $\mathcal{C}$
  • 二項関手 $\otimes : \mathcal{C} \times \mathcal{C} \to \mathcal{C}$ ── テンソル積(「横に並べる」操作)
  • 対象 $I \in \mathcal{C}$ ── 単位対象(掛け算の「1」のように、横に並べても相手を変えない部品)
  • 自然同型 $\alpha_{A,B,C} : (A \otimes B) \otimes C \xrightarrow{\sim} A \otimes (B \otimes C)$ ── 結合子(associator)
  • 自然同型 $\lambda_A : I \otimes A \xrightarrow{\sim} A$ と $\rho_A : A \otimes I \xrightarrow{\sim} A$ ── 単位子(unitor)

これらが、五角形公理(pentagon axiom)三角形公理(triangle axiom) という2つの整合条件を満たすもの。

これが、Mac Lane の『Categories for the Working Mathematician』をはじめ、たいていの専門書に登場する定義だ。

学部生:

…記号は、正直、半分も追えませんでした。

講師:

それでいい。ここで伝えたいのは記号そのものじゃなく、この定義が何を言っているかだ。噛みくだくと、こうなる。

  • 圏 $\mathcal{C}$ は「縦につなぐ(合成)」を、最初から持っている。
  • そこに「横に並べる(テンソル積 $\otimes$)」を足す。
  • $I$ は「何もしないプラグ」── 横に並べても相手を変えない、単位のような部品。
  • 結合子 $\alpha$ と単位子 $\lambda, \rho$ は、「どの順でカッコをつけて組んでも、結局おなじ」 ことを保証する仕掛け。
    $(A \otimes B) \otimes C$ と $A \otimes (B \otimes C)$ を、ちゃんと"同じもの"とみなせる、という約束だ。
  • 五角形公理・三角形公理は、その"同じとみなす"が矛盾なく成り立つための、最小限のルール。

そして、ここが美しいところだ。

Mac Lane の整合性定理(coherence theorem) が、「これらの条件さえ満たせば、カッコの付け方や並べ替えで生じる"つなぎ直し"は、どう辿っても必ず一致する」と保証してくれる。

学部生:
だから僕らは、安心して、「ただ縦につなぎ、横に並べる」 とだけ考えていればいい。

講師:

そういうことだ。

専門書の厳密な定義は、その"安心"を数学的に裏づけるためにある
定義を暗記する必要はない。

「縦につなぐ・横に並べる、が破綻なく両立する世界」
── その直感
さえ持っていれば、Compositional Game Theory の本質は十分につかめる。

学部生:
あ、QNLP と同じ構造。

講師:
そう。

実は、Compositional Game Theory も、QNLP も、現代の量子コンピューティングも、現代のプログラミング言語の理論もすべて同じモノイダル圏の枠組みで扱える。

これが、圏論の力 なんだ。遠く離れた分野が、同じ数学的構造を共有している

学部生:
すごい。同じ枠組みで、ゲーム理論と量子と言語が、つながる。

pic_20.jpg

講師:
そして、Open Games画期的な点 は、こうだ。

プラグ同士をつないだ大きなゲームのNash均衡を、各プラグのNash均衡から「組み立てられる」

つまり、大きなゲーム全体を一度に分析する必要がない

各部品を分析し、それを合成することで、全体の振る舞いが計算できる。

学部生:
プログラミングのモジュール化と、同じ精神ですね。

pic_21.jpg

講師:
完全にそうだ。

ソフトウェアエンジニアリングが、巨大なシステムを小さなモジュールに分解して管理可能にしたのと同じように、Compositional Game Theory は、巨大な経済モデルを小さなゲームに分解して管理可能にする

学部生:
これは、本当に必要な発想ですね。

講師:
さらに、Bayesian Open Games(Bolt, Hedges, Zahn 2019) として、不確実性の組み込みも扱える。

プレイヤーが不完全な情報の下で行動する状況も、合成的に扱える。

pic_22.jpg

そして、Open Games のフレームワークは、Haskell のライブラリ open-games-hs で実装されている。君も、Python に慣れていれば、Haskell のコードも比較的読みやすいはずだ。

https://github.com/jules-hedges/open-games-hs

学部生:
GitHub に、公開されているんですね。

講師:
そう。研究の最前線が、オープンソースで公開されている。これは、現代の計算機科学・経済学の良い側面だ。

学部生:
関数型言語の Haskell ですね!

前回のQNLPのときは、「圏論なんだから、関数型プログラミング言語でライブラリが実装されているのかな」と思いきや、先生から「Python で実装されている」と教えていただきました。

(でも、「関数型言語と QNLP は相性がよさそう」という私の感覚自体は間違っていない、と評価してくださいましたよね)

今回は、Haskell が実装言語に選ばれているようで、なんだかすっきりしました。

講師:
いい記憶だ。そして、その「すっきり」した感覚は、的を射ている。

圏論的な構造 ── 対象と射、合成、型 ── は、Haskell の型システムや関数合成と、ほとんど地続きだ。
だから、Open Games のように、「部品を型のついた射として合成する」枠組みは、Haskell でとても自然に書ける。

ただ、前回の QNLP で念を押したことを、ここでもう一度言っておく。

「圏論だから必ず関数型言語」ではない

QNLPlambeq が Python で実装されていたように、実装言語の選択は、ライブラリの設計思想・対象ユーザー・既存の生態系(エコシステム)で決まる。

Haskell が選ばれるのは「圏論の必然」というより、「この種の型と合成を扱うのに、たまたま Haskell がとても向いている」という相性の問題だ。

君の感覚 ──「関数型言語と、こうした圏論ベースの枠組みは相性がよい」── は、その意味で正しい。


第3幕 ── Nash 均衡を、圏論的に再定義する

pic_23.jpg

学部生:
じゃあ、Nash均衡は、Open Games の枠組みでは、どう扱われるんですか?

講師:
そこが、極めて美しい部分 だ。

伝統的なゲーム理論 では、Nash均衡は、「他のプレイヤーの戦略が固定された状態で、自分だけ戦略を変えても、利得が改善しない」状態として定義された。

これを、Compositional Game Theory では、**圏論的な「不動点」**として再定義する。

学部生:
不動点、ですか?

講師:
不動点(fixed point) は、「自分自身に戻ってくる点」のこと。

例えば、関数 $f(x) = x^2$ の不動点は、$f(x) = x$ を満たす $x$、つまり $x^2 = x$、解は $x = 0$ と $x = 1$。

ある操作を施しても、変わらない点 ── これが不動点だ。

Nash均衡は、まさにこれだ。

各プレイヤーの「最善反応」を計算しても、戦略が変わらない状態。それが Nash 均衡。

学部生:
最善反応ですか?

講師:
最善反応(best response):
他のプレイヤーの戦略が与えられた時、自分にとって最も利得が高い戦略。

各プレイヤーの最善反応を計算する関数を $BR$ と書こう。
Nash 均衡は、$BR$ の不動点
── 「最善反応を計算しても、戦略が変わらない点」。

これは、関数解析・圏論の不動点理論の標準的な道具で扱える。

学部生:
ということは、Nash均衡の計算が、不動点の計算になる。

講師:
そういうこと。

Open Games の各プラグについて、不動点を見つけることで、各部品の Nash均衡が得られる。

そして、部品同士の合成は、不動点の合成として扱える

これにより、以下のことが可能になる。
 

  1. 各プラグの均衡を、独立に計算できる
     
  2. プラグを合成した大きなゲームの均衡を、各プラグの均衡から構築できる
     
  3. ゲームの一部を変更した時の影響が、局所的に追跡できる
     

pic_24.jpg

学部生:
これは、プログラムのデバッグに似ていますね。

一部分の変更が、全体に与える影響を、局所的に分析できる

講師:
まさにそうだ。

伝統的なゲーム理論 では、ゲームの一部を変更すると、全体を再計算する必要があった。

Compositional Game Theory では、変更した部分だけを再計算し、合成によって全体への影響を計算できる

これは、ソフトウェアエンジニアリングが「インクリメンタル・コンパイル」(変更した部分だけを再コンパイル)を発明したのと、構造として同じ。

学部生:
ソフトウェア工学の発想を、ゲーム理論に持ち込んだ感じですね。

pic_25.jpg

講師:
そうなるね。

実際、Jules Hedges が研究を進めてきた Strathclyde の研究グループは、「Mathematically Structured Programming(数学的に構造化されたプログラミング)」をその名に冠している。

彼の発想の根っこは、計算機科学・型理論・関数型プログラミングにあると思うんだ。

そこに、経済学者の Winschel と Zahn が加わり、経済学と計算機科学の交差領域として、Compositional Game Theory が育った。

pic_26.jpg


第4幕 ── 具体例: 囚人のジレンマを、プラグとして組み立てる

pic_27.jpg

学部生:
理論は分かりました。でも、具体的に囚人のジレンマを Open Games で書いたら、どうなるんですか?

講師:
よし、概念レベルで見てみよう。
(コードの詳細は、論文やGitHubリポジトリを参照してみてほしい)。

囚人のジレンマの Open Games 表現:

# 概念レベルの擬似コード
prisoner_a = OpenGame(
    observation=external_context,  # 取り調べの状況を観察
    choice=["黙秘", "自白"],         # 二つの選択肢
    payoff=lambda a, b: get_payoff(a, b)  # 自分と相手の選択から利得を計算
)

prisoner_b = OpenGame(
    observation=external_context,
    choice=["黙秘", "自白"],
    payoff=lambda a, b: get_payoff(b, a)
)

# 二人を並列に合成
prisoners_dilemma = parallel_compose(prisoner_a, prisoner_b)

# Nash 均衡を計算
equilibrium = find_fixed_point(prisoners_dilemma)
# 結果: 両者「自白」が Nash 均衡

学部生:
これは、確かにプラグの組み合わせとして書けていますね。

講師:
そう。そして、この構造の真価が現れるのは、もっと複雑なゲームを考えた時だ。

例えば、取り調べに弁護士が加わる場合を考えてみよう。

学部生:
弁護士が加わると、どうなるんですか?

講師:
弁護士は、各囚人とは別のプレイヤーだ。
弁護士は、依頼人(囚人)の利得を最大化するために、戦略をアドバイスする。

伝統的なゲーム理論では、これは新しいゲームとして、ゼロから書き直す必要がある。

それが、Compositional Game Theory では、既存の囚人プラグに、弁護士プラグを「接続」するだけで済む

lawyer_a = OpenGame(
    observation=prisoner_a_situation,
    choice=["黙秘を推奨", "自白を推奨"],
    payoff=lambda recommendation, prisoner_choice: legal_fee
)

# 弁護士と囚人を、逐次合成(弁護士のアドバイスが、囚人の選択に影響)
lawyer_prisoner_a = sequential_compose(lawyer_a, prisoner_a)
lawyer_prisoner_b = sequential_compose(lawyer_b, prisoner_b)

# 全体を並列合成
full_game = parallel_compose(lawyer_prisoner_a, lawyer_prisoner_b)

equilibrium = find_fixed_point(full_game)

学部生:
これは、本当にレゴブロックみたいですね!
新しいプレイヤーを追加しても、既存の部品を再利用できる

講師:
そう。これが、「ゲームを部品から組み立てる」 ことの実用的な威力だ。

現実の経済モデルは、ほぼ常に、こうした部品の組み立てを必要としている。
Compositional Game Theory は、これに数学的に厳密な道具を与える。


第5幕 ── 「ベイズ的不確実性」も扱える ── Bayesian Open Games

pic_28.jpg

学部生:
ここまでは、各プレイヤーが、相手の戦略を完全に観察できる、という前提だったと思います。

でも、現実には、プレイヤーは相手の情報を不完全にしか持たないことが多いですよね。

講師:
鋭いところを突くね。

実際、現実のゲーム理論の多くは、不完備情報 (incomplete information)を含む。

例えば、

  • オークションで、他の入札者の評価額は分からない
  • 株式市場で、他の投資家の予測は分からない
  • 軍事戦略で、敵の戦力は分からない

これらを扱うベイズ的ゲーム (Bayesian game)は、John Harsanyi が1960年代に体系化して、1994年にノーベル経済学賞を受賞した。

そして、Bayesian Open Games(Bolt, Hedges, Zahn 2019)は、この不完備情報を、Compositional Game Theory の枠組みに自然に組み込んだ拡張 だ。

学部生:
具体的には、どう違うんですか?

講師:
各プレイヤーが、**事前確率(prior beliefs)**を持つ。
他のプレイヤーの「タイプ」(性格、評価、能力)が、ある確率分布に従う、と仮定する。

そして、各プレイヤーは、自分のタイプを観察し、相手のタイプの分布を考慮して、戦略を選ぶ。

学部生:
ベイズ統計と、ゲーム理論が、合わさったような感じですね。

pic_29.jpg

講師:
そう。

そして、Bayesian Open Games の素晴らしい点は、ベイズ更新も合成的に扱えること。

新しい情報を観察したプレイヤーが、事後確率(posterior beliefs)に更新する
── これが、各プラグの中で、局所的に 行われる。

pic_30.jpg

学部生:
これは、Bayesian Network(ベイジアンネットワーク)と、構造的に近いですか?

講師:
構造的には親戚だ。

実際、Compositional Game Theory の最近の発展は、Categorical Probability Theory (圏論的確率論、Tobias Fritzらの研究)と深く絡んでいる。

学部生:
Categorical Probability Theory?

講師:
確率論を、圏論の言葉で書き直す研究領域のこと。

Markov CategoriesString Diagrams for Probability などのキーワードで、ここ10年ほどの間に急速に発展している。

学部生:
その分野、もう少し具体的に知りたいです。代表的な論文って、ありますか?

講師:
いくつか挙げよう。どれも arXiv で無料で読める。

出発点(この分野を一気に整理した一篇)

  • Tobias Fritz (2020). "A synthetic approach to Markov kernels, conditional independence and theorems on sufficient statistics." Advances in Mathematics, 370.(arXiv:1908.07021)

さっき名前を挙げた論文だ。

Markov 圏(Markov categories) を、確率・統計を「総合的(synthetic)」に扱う枠組みとして整備した。

条件付け、条件付き独立、十分統計量といった統計の基本概念を、すべて圏論の言葉で書き直してみせた。

離散確率・測度論的確率・ガウス確率・確率過程などを、ひとつの枠組みで統一的に扱える のが強みだ。

土台(その前夜の仕事)

  • Kenta Cho & Bart Jacobs (2019). "Disintegration and Bayesian inversion via string diagrams." Mathematical Structures in Computer Science, 29.(arXiv:1709.00322)

ベイズ反転(Bayesian inversion)── 観察から事前を事後へ更新する操作 ── を、ストリング図(string diagram) で表す方法を示した論文。

第5幕で見た「ベイズ更新」を圏論的に扱う、ちょうど土台にあたる仕事だ。

源流(古典的な出発点)

  • Michèle Giry (1982). "A categorical approach to probability theory." In Categorical Aspects of Topology and Analysis, Springer.

確率測度を圏論的な「モナド(monad)」として捉える、Giry モナドを導入した古典。

圏論的確率論の遠い源流で、後続のほぼすべての仕事がここを参照している。

学部生:
Fritz の論文が「現代の整理」で、Cho–Jacobs が「ベイズ更新の土台」、Giry が「源流」── という地図ですね。

講師:
その通り。

そしてこの圏論的確率論こそが、Bayesian Open Games が、不確実性を合成的に扱うときに足場にしている数学なんだ。

確率論と、ゲーム理論と、圏論が、ここでも一本につながっている。

そして、ベイジアンネットワーク、確率プログラミング、機械学習
── これら全てが、圏論的確率論の枠組みで、統一的に扱える可能性 が見えてきた。

Compositional Game Theory は、この圏論的確率論を、ゲーム理論に応用した形になっている。

学部生:
全てつながってますね…

講師:
そう。


第6幕 ── どこに使われるのか? オークション、メカニズムデザイン、AI 安全性

pic_31.jpg

学部生:
ここまでで、Compositional Game Theory の理論的な仕組みは、だいたい掴めました。

でも、これは実際に、どこで使われているんですか?

講師:
いい質問だ。

正直に言うと、Compositional Game Theory は、まだ研究段階だ。

商業的な大規模応用は、これからの段階。

ただし、いくつかの応用領域で、研究と実装が進んでいる。

応用領域1: オークション設計

Google、eBay、Microsoft などのプラットフォーム企業は、広告枠やクラウドリソースのオークションを、毎秒大量に運営している。

これらのオークションのメカニズムを、Compositional Game Theory で合成的に設計・分析することで、より効率的なオークションが作れる可能性がある。

学部生:
Google の検索広告って、ゲーム理論で動いてるんですか?

講師:
そうだ。Google の AdWords/Ads は、Generalized Second-Price (GSP) auction という形式で動いている。これは、Vickrey-Clarke-Groves(VCG)メカニズムの変種で、メカニズムデザイン理論の応用の典型例だ。

応用領域2: メカニズムデザイン

メカニズムデザインは、「プレイヤーの戦略的行動を考慮して、望ましい結果を達成するルールを設計する」分野。

例えば、腎臓移植のドナーマッチング。提供したい人と必要としている人を、ゲーム理論的に最適にマッチングする(Alvin Roth の業績、2012年ノーベル経済学賞)。

応用領域3: マルチエージェント AI (古典的な事例)

複数の AI エージェントが、互いに相互作用する状況。例えば、自動運転車の集団、ロボット工場、対戦型 AI(StarCraft、Dota 2、ポーカー)。

DeepMindAlphaStar(StarCraft II AI)、OpenAI Five(Dota 2 AI)、Pluribus(マルチプレイヤーポーカー)── これらは、すべてゲーム理論的な発想で訓練されている。

Compositional Game Theory は、より複雑なマルチエージェント環境を、部品から組み立てて設計することを可能にしうる。

応用領域4: 2026年の AI Agent 社会と、エージェント間通信プロトコル

pic_32.jpg

学部生:
最近、AI Agentという言葉、よく聞きます。

ChatGPT に何かをやらせる、というだけじゃなくて、AI 自身が、ツールを使って、自律的に行動する、という。

講師:
そう、2024〜2025年で、世界は大きく変わった。

AI Agent」 ──「ある目標を与えられて、自律的にツールを使いながら、複数のステップで仕事を進める AI」── が、現実の選択肢になった。

そして、ここからが、ゲーム理論との接続として、決定的に重要な変化 だ。

複数の AI Agent が、互いに通信し、協調・競合する世界が、いま、現実に作られつつある。
これを Multi-Agent Systems(マルチエージェント・システム)と呼ぶ。

学部生:
それは、AlphaStar や OpenAI Five と、何が違うんですか?

講師:
大きく違うのは、相互運用性(interoperability) だ。

AlphaStar や OpenAI Five は、同じ会社が同じ目的のために訓練した、閉じたエージェント群 だ。
一つのゲームの中で、内部的に協調・競合する。

これに対し、2026年のAI Agent 社会で問題になっているのは、まったく異なる会社が、異なる目的で作った、異なるフレームワークのエージェントが、互いに通信し、仕事を委任し合えるか、という課題だ。

例えば
── 君が、自分のスケジュール管理 AI Agent を持っている。

会社の経理 AI Agent と、取引先の請求書 AI Agent が、君のスケジュール AI Agentと通信して、会議の予定を自動調整する。

これが「2026年の AI Agent 社会」の典型的なシナリオだ。

このために、2つの重要なプロトコル(通信規約)が、近年立て続けに登場した。

プロトコル1: MCP (Model Context Protocol、モデルコンテキストプロトコル)

Anthropic2024年11月 に発表したオープンスタンダードだ。
LSP(Language Server Protocol、エディタとプログラミング言語処理系の通信規約)に着想を得て設計された。

ただし、ここで用語の正確性を担保するために、慎重を期そう

Anthropic の MCP は、ツール・データソースへの接続プロトコルとして提唱されたものであり、純粋なエージェント間通信プロトコルとは少し違う

MCP の構造は、こうだ。

  • MCP クライアント:AI アプリケーション(Claude、ChatGPT に類するもの)
  • MCP サーバー:データソース・ツール(Google Drive、Slack、GitHub、Postgres、Puppeteer 等)

両者の間の通信を、標準化された規約で行う。
Anthropic はこれを「AI アプリケーション用の USB-C ポート」と比喩した。

MCP が解決しようとした問題は「$N×M$ 統合問題
── $M$ 個のAIアプリケーションが、$N$ 個の外部サービスとカスタム統合すると、$N×M$ 個の接続を個別に書く必要が生じる
── これを、一つの標準で置き換える試みだ。

プロトコル2: A2A (Agent2Agent、エージェントツーエージェント)

Google2025年4月9日、Google Cloud Next で発表したオープンプロトコル。
2025年6月、Linux Foundation に寄贈され、ベンダー中立な統治体制に移行した。

A2A の目的は、まさに異なるベンダー・異なるフレームワークの AI エージェント同士が、互いを発見し、タスクを委任し、協調することだ。

技術的には、HTTP、Server-Sent Events、JSON-RPC 2.0 を使う。

各エージェントは、「Agent Card」というメタデータで自分の能力を公開し、他のエージェントから発見される。タスクは「Task」という単位で委任される。

A2A には、Atlassian、Box、Cohere、Intuit、LangChain、MongoDB、PayPal、Salesforce、SAP、ServiceNow、Workday など、50を超える企業がパートナーとして参加している。

学部生:
MCP と A2A は、競合関係なんですか?

講師:
いや、補完関係(complementary) だ。

整理すると、こうなる ──

  • MCP = エージェント $↔$ ツール・データソース の通信
  • A2A = エージェント $↔$ エージェント の通信

両者が組み合わさることで、「マルチエージェント・システムの相互運用性スタック(interoperability stack for multi-agent systems)」が形成される。

学部生:
そして、これが、Compositional Game Theory と、どう繋がるんですか?

講師:
これが、今日の対話の、最も時代的な接点だ。

異なるベンダーの AIエージェントが、互いに通信し、タスクを委任し合う世界を考えてみてくれ。

エージェント $A$ (Salesforce製)、
エージェント $B$ (Workday製)、
エージェント $C$ (Atlassian製)
── これらが、A2Aプロトコルで通信しながら、ある共通の目標(例:採用候補者のソーシング、面接スケジューリング、入社手続き)を達成しようとする。

各エージェントは、自分の目標と制約を持ち、戦略を選択し、結果を観察し、評価する

これは、まさに第2幕で見た Open Game の4つの入出力 $X, Y, R, S$ と一対一に対応する構造だ。

そして、これらのエージェント同士の相互作用は、Compositional Game Theory のプラグの合成として、数学的に厳密に扱える

つまり、

将来の AI Agent 社会では、異なるベンダーのエージェント同士が A2A プロトコルで通信し、それぞれがツールを MCP で扱う。

そして、その全体の相互作用を、Compositional Game Theory が設計・分析する

── という未来像 が、見えてくる。

pic_33.jpg

学部生:
これは、本当に、2026年の今、起きている話なんですね。

講師:
その通り。

AI Agent / Multi-Agent Systems / MCP / A2A は、すべて、ここ1〜2年で立ち上がった分野だ。

Compositional Game Theory は、まだ若い理論だが、この AI Agent 社会の数学的基盤になる可能性を、確かに持っている。

そして、これは「何百万のエージェントが、互いに通信し、ゲームをプレイし合う」という、伝統的なゲーム理論では到底扱えなかった規模の問題だ。

部品から組み立てる Compositional Game Theory の発想が、必須になる領域だ。

pic_34.jpg

応用領域5: スマートコントラクト

EthereumSolana などのブロックチェーン上で動くスマートコントラクト。

これらは、経済的なインセンティブが組み込まれている。

例えば、DeFi(分散金融)プロトコル ── Uniswap、Aave、Compound ── は、ユーザー、流動性提供者、アービトラージャー、ガバナンストークン保有者など、複数のプレイヤーが相互作用するゲームだ。

Compositional Game Theory は、これらのプロトコルを合成的に分析・設計することで、より安全で効率的な仕組み を作ることができるようになる可能性がある。

学部生:
ブロックチェーンと、ゲーム理論が、こんなにつながっているとは。

講師:
そうなんだ。

pic_35.png

応用領域6: AI 安全性

これは、最も新しい応用領域の一つ。

AIが複数の目標を最適化する時の、人間の意図との整合性(AI Alignment)を、ゲーム理論的に扱う研究が、近年急速に発展している。

Stuart Russell(UC Berkeley、AI 教科書の著者)や、Anthropic、DeepMind、OpenAI安全性チーム が、関連する研究を進めている。

Compositional Game Theory は、複雑な AI システムの安全性を、部品から組み立てて検証することを可能にしうる。

学部生:
AIの安全性に、ゲーム理論的視座が使えるんですね。

講師:
そう。これは、今後10年で、最も重要な応用領域の一つになる可能性が高い。

学部生:
その分野の代表的な論文って、ありますか? 兄貴にも教えたくて。

講師:
ある。

AI 安全性をゲームとして定式化した、出発点になる仕事を挙げよう。

価値整合をゲームとして定式化した出発点

  • Dylan Hadfield-Menell, Stuart Russell, Pieter Abbeel, Anca Dragan (2016). "Cooperative Inverse Reinforcement Learning." NeurIPS(NIPS)2016.(arXiv:1606.03137)

通称 CIRL

「AI が人間の意図に沿う」という価値整合 (value alignment)の問題 を、人間とロボットの2人による協力ゲームとして、初めて明確に定式化した論文 だ。

ポイントは、ロボットが人間の報酬関数を 最初は知らないこと。

ロボットの利得は人間の報酬そのものなので、ロボットは人間を観察して、その意図を推し量りながら動く
まさにゲーム理論的な定式化だ。

「AI が自分の停止を妨げないのはどんな条件か」を分析した一篇

  • Dylan Hadfield-Menell, Anca Dragan, Pieter Abbeel, Stuart Russell (2017). "The Off-Switch Game."(arXiv:1611.08219)

「報酬を最大化するよう設計された高度なAI は、人間が電源を切る(=報酬の獲得を止める)操作を、妨げる方向に動いてしまうのではないか」という懸念を、人間とAIの2人ゲームとして定式化した論文。

鍵は、AIが、「自分の報酬関数は正しいとは限らず、人間の判断のほうが正しいかもしれない」という不確実性を持つように設計することだ。

論文は、AIが人間による停止操作を妨げないことが、AI自身の報酬を最大化する行動として均衡になる条件を、ゲーム理論的に示した。

AIの安全性とゲーム理論の結びつきを象徴する有名な一篇だ。

学部生:
AIの安全性に、ゲーム理論的視座が使えるんですね。

講師:

そう。これは、今後10年で、最も重要な応用領域の一つになる可能性が高い。

そして、ここで大事なのは ── これらは2人ゲームの定式化だということだ。

現実の AI システムは、もっと多くのエージェント・ツール・人間が絡む。

その複雑な全体を「部品から組み立てて検証する」ところに、Compositional Game Theory の出番がある

CIRL や Off-Switch Game のような「安全性の部品」を、合成的につないで大きなシステムの安全性を分析する ── それが、これから開けていく方向だ。

学部生:
ちなみに ── すでに企業で、この Compositional Game Theory の仕組みを実装した事例ってあるんですか?

講師:
正直に答えよう。「これで儲けている大企業の本番システム」という意味での、大規模な商業実装は、まだほとんどない

Compositional Game Theory 自体が、まだ研究段階の若い理論だからだ。

ただし、「研究室の中だけの空論」でもない。
実際に動くものは、いくつもある。

まず、動くコードが公開されている

本文でも触れた Haskellの open-games-hs がそれだ。

さらに、経済モデルや制度設計を扱った査読論文(Frey, Hedges, Tan, Zahn ら 2023, PLOS ONE)では、Open Games の実装(Haskell ライブラリ)と全例題のコードが公開されていて、誰でも動かして検証できる。

そして、この理論を応用に橋渡しすることを目的とした組織も生まれている。

第3幕で名前を出した 20squares がそれだ。

HedgesやZahnらが関わる、Compositional Game Theory を、現実の経済設計・メカニズム設計に応用しようとするグループ で、ブロックチェーンや市場設計まわりの案件 に取り組んでいる。

20Squaresのサイトには、HedgesやZahnらの個人名は明示されていません。

この記事で、「Hedges や Zahn らが関わる」とご紹介したことの根拠は、本文でも引用している Bayesian Open Games 論文(Bolt, Hedges, Zahn 2019/2023)の著者所属に「20squares」が明記されていることをよりどころにしています。

学部生:

「製品に組み込まれて何百万人が使っている」段階ではないけれど、「動く実装があって、応用組織が動き始めている」段階、ということですね。

講師:

その通り。

正確に言えば ── 理論と実装は存在し、応用の入り口に研究者と専門組織が立っている。
だが、大企業の基幹システムに広く組み込まれる、という段階にはまだ至っていない

だからこそ、いま面白いとも言える。

完成しきった枯れた技術ではなく、これから10〜20年かけて、実装と応用が育っていく途中なんだ。

君のように、Python を書きながらこの分野を眺めているエンジニアが、その成長に立ち会える ── そういうタイミングだ。


第7幕(発展的な話題 ── 著者の関心領域)── 経営・リスク管理との接続

ERM・FP&A という言葉に馴染みのない読者の方は、本章を読み飛ばしていただいても、記事全体の理解には全く影響しません**。

ただ、もし「経済学・経営・金融への応用が、どう開けてくるのか」にご興味をお持ちでしたら、最後までお付き合いください。**

本章で参照する経営概念(ERM、FP&A、リスクとリターンの連動)は、本記事著者の note 連載で詳しく扱われています ── 章末にリンクを掲示します。

pic_36.jpg


学部生:
先生、Compositional Game Theory って、経営リスク管理にも応用できるんですか?

講師:
極めて重要な領域だ。
実は、これが現代の企業リスク管理(ERM)とFP&A 統合の、最も深い接続点になりうる。

学部生:
ERMとFP&A、ですか?
初めて聞く言葉で。

講師:
よし、まずそこから、丁寧に説明しよう。

ERM と FP&A ── Qiita 読者のための入門

ERM (Enterprise Risk Management、全社的リスク管理) は、企業が直面するあらゆるリスク ── 信用リスク、市場リスク、オペレーショナルリスク、法務リスク、地政学リスク、サイバーリスク等 ── を、全社的に、統合的に管理する仕組みだ。

伝統的には、「リスクを認識し、測定し、回避する」ことに焦点が置かれてきた。
守りの仕事だ。

FP&A (Financial Planning & Analysis、財務計画・分析) は、企業の予算策定、業績予測、経営計画、資本配分を担当する。
こちらは、いわば、攻めの仕事だ。

伝統的には、ERM と FP&A は、別々の部署で運営されてきた。

リスク管理部門と、経営企画部門
── 別組織で、別のサイクル(リスク管理は四半期、経営企画は月次)で動いていた。

学部生:
それが、どう問題なんですか?

講師:
現実の経営判断は、両者を同時に考慮する必要があるからだ。

リスクを取れば、リターンも取れる
リスクを過度に避ければ、リターンも失う。

「攻め」と「守り」は、表裏一体だ。
だから、ERM と FP&A が別々の時間サイクルで動いていると、経営判断が常に遅れる

例えば、ある事業のリスクが急変した時、ERM 部門が四半期報告で気づくのは、3ヶ月後。
FP&A部門が予算を修正するのは、さらにその数週間後。

意思決定の総遅延が、半年近くになる

この間に、世の中は動いている。
競合は手を打っている。
市場環境は変わっている。

判断が、現実から半年遅れる

学部生:
これは、大きな経営問題ですね。

講師:
この記事の執筆者が執筆中の note連載記事で、繰り返し論じられてきた中心命題は、まさにこれだ。

① RAROC(リスク調整後リターン)とは何か ── ERM と FP&A の連動を、最初に橋渡しする指標

② リアルタイム連動を実現している例外的な業界(金融機関と総合商社)の構造

③ ゼネコン業界 ── 月次の壁を3次元の現場データが越えていく

Qiita記事もある。

「ERM と FP&A の連動を、月次や四半期ではなく、日次あるいは時間単位(hourly)で回す」

「攻めと守りのリアルタイム連動」

これが、現代の企業経営の、最も切実な課題の一つとして、議論されている。

③ ゼネコン業界 ── 月次の壁を3次元の現場データが越えていく

特に③の記事から、note 連載の核心となる文章を、一部引用してみるよ。

ERM(全社的リスク管理)と FP&A(財務計画・分析)の連動を、月次や四半期ではなく、日次あるいは時間単位(hourly)で回す

リスクが顕在化したその瞬間に、経済資本配賦が動き、RAROC が再計算され、経営判断が下される

これが、note 連載が掲げる理想像だ。

そして、金融機関と総合商社は、すでにこの理想に近い動きをしている。

その他の業界 ── ゼネコン、エネルギー、重工業、流通、自動車、製薬、AI テック ── は、どこに立っているのか。そこに向かう道のりは何か。これが、note 連載の中心テーマだ。

学部生:
それと、Compositional Game Theory が、同がつながるんですか?

講師:
ここからが、本日の対話の、最も深い接続点だ。

ステークホルダー間のゲームとしての現代経営

現代の経営は、ステークホルダーの間で繰り広げられる登場する主体の多いゲームとして捉えられる:

  • 株主 vs 経営陣(エージェンシー問題)
  • 会社 vs 競合他社(競争戦略)
  • 会社 vs 規制当局(コンプライアンス)
  • 会社 vs 顧客(価格戦略)
  • 会社 vs サプライヤー(調達戦略)
  • 会社 vs 従業員(報酬・モチベーション設計)
  • 会社 vs 金融機関(資金調達戦略)
  • 会社 vs 格付機関(信用評価戦略)

これら全てが、同時に進行する複数のゲームだ。

学部生:
それを、一つの巨大なゲームとして書き下ろすのは、無理ですね。

講師:
そう思うでしょう?

けれども、伝統的な経営学 では、これらを別々のフレームワークで扱ってきた。

経営学のマイケル・ポーターの5つの力バリューチェーン分析SWOT 分析シナリオ・プランニング ── どれも、特定の側面に焦点を絞った道具だ。

Compositional Game Theory は、これら多様なステークホルダーゲームを、合成的に統合する枠組みを与える可能性がある。

学部生:
それが、実装されたら、経営判断は、どう変わるんですか?

講師:
インクリメンタルな意思決定が可能になる。

例えば、ある事業部門の戦略を変更した時、その変更が、他の事業部門、規制当局、競合、株主、サプライヤー、顧客にどう波及するかを、合成的に分析できる。

伝統的なシナリオ分析では、これを手作業で行ってきた。

Compositional Game Theory が成熟すれば、これを形式化された道具として扱える。

学部生:
それと、ERM × FP&A の日次連動が、どう関係するんですか?

講師:
直接、深く関係する。

ERM × FP&A の日次連動は、note 連載によれば、8ステップの循環として整理されている:

リスクの変化 → 経済資本の変化 → RAROC の再計算 → 経営判断 → 戦略の実行 → 結果の観察 → リスクの再評価 → 次のサイクルへ

この循環の各ステップは、プレイヤー(株主、経営陣、各事業部、規制当局、競合、顧客等)の戦略選択と、その結果から成る。

つまり、ERM×FP&Aの8ステップの循環構造は、Compositional Game Theory の「合成された Open Games の不動点計算」として、数学的に厳密に再構成できる可能性がある

pic_37.jpg

学部生:
これは、本当に大きな変化ですね。
この記事の執筆者がnoteで書いている連載記事、これから読んでみます。

IFRS という、追い風の構造変化

最後に、ひとつだけ補足する。

ERM × FP&A の日次連動を、技術的・思想的に推進してきたのは、note 連載によれば、**国際財務報告基準(IFRS)**の影響も大きい。

特に IFRS 第15号(収益認識)IFRS 第9号(金融商品の予想信用損失モデル)IFRS 第17号(保険契約)は、いずれも「リスク情報と財務数値を同じ言語で語らせる」方向に、企業を規律付ける。

これにより、ERM のリスク情報と、FP&A の財務数値が、会計基準そのものの中で、構造的に連動するようになりつつある。

つまり、Compositional Game Theory(数学・圏論側) と、IFRS(会計基準側) が、同じ方向を指し示している ── これが、現代の経営の、最も深い構造変化の一つだ。


第8幕 ── 学習リソースと次の一歩

pic_38.jpg

学部生:
ここまでで、Compositional Game Theory の輪郭が、だいぶ見えてきました。

もっと深く学びたい場合、何を読めばいいですか?

講師:
段階別に、いくつか推奨ルートを示そう。

1歩目: 対話的な入門(本記事の延長)

本記事の参考文献(記事末)を、まず一つずつ Google Scholar や arXiv で検索してみるといい。
Jules Hedges の最近の論文は、すべて arXiv で無料で読める。

2歩目: Jules Hedges の博士論文

  • Hedges, Jules (2017). "Towards compositional game theory." PhD thesis, Queen Mary University of London.

これは、Compositional Game Theory の出発点。約200ページの大著で、博士論文としては比較的読みやすい(数学的記号は多いが、丁寧な説明がある)。

3歩目: LICS 2018 論文

  • Ghani, Hedges, Winschel, Zahn (2018). "Compositional game theory." LICS 2018.

これが、研究コミュニティの公式な出発点。博士論文より凝縮された、読みやすい論文

4歩目: Open Games の Haskell 実装

  • GitHub: jules-hedges/open-games-hs

実際にコードを動かしてみる。Haskell に慣れていなくても、コードの構造は、Python プログラマにも比較的理解しやすい。

5歩目: Categorical Cybernetics

  • Capucci, Gavranović, Hedges, Rischel (2022). "Towards foundations of categorical cybernetics." ACT 2021.

最新の発展方向。

Compositional Game Theory が、より広い「圏論的サイバネティクス」(categorical cybernetics)として、機械学習、制御理論、強化学習と接続している。

学部生:
その「圏論的サイバネティクス」って、何ですか?
急に出てきて、ちょっと置いていかれました。

講師:
いい質問だ。
これは、Compositional Game Theory を一段高いところから見直す枠組みだと思ってほしい。

提唱したのは、Capucci・Gavranović・Hedges・Rischel(2021) の論文
── タイトルはずばり "Towards Foundations of Categorical Cybernetics"(圏論的サイバネティクスの基礎に向けて)だ。

学部生:
サイバネティクス…制御工学の、あのサイバネティクスですか?

講師:
そう、語源はそこだ。

**「環境とやりとりしながら、フィードバックを受けて振る舞いを調整するシステム」**を扱う、という精神を受け継いでいる。

圏論的サイバネティクスは、それを圏論の言葉で定式化する。

核になるアイデアは、こうだ。

「環境」と「コントローラ(制御する側)」の両方と、双方向にやりとりするプロセスを、ひとつの共通の枠組みでとらえる。

前向きに情報を送り(行動・予測)、後ろ向きに情報が返ってくる(結果・誤差)── この双方向の流れを、圏論的な部品として合成できる形で 書く。

そして、ここが面白いところだ。

この枠組みに、コントローラとして何を差し込むかで、別々に見えた分野が同じ姿になる。

  • コントローラに 勾配降下のような最適化器 を差し込むと ── 機械学習(ニューラルネットの学習)になる。第2幕で触れた「Backprop as Functor(関手としての誤差逆伝播)」が、まさにこれだ。
  • コントローラに ゲーム理論的なエージェント(の合成) を差し込むと ── Open Games、つまり Compositional Game Theory になる。
  • コントローラに 方策を改善していく主体 を据えれば ── 制御理論や強化学習として読める。

学部生:
同じ「双方向のプロセス」という骨格に、差し込む中身を変えるだけで、学習にもゲームにも制御にもなる、ということですか。

講師:
その通り。

Open Games は、その大きな家族の一員なんだ。

第2幕で、「縦につなぐ・横に並べる」と言った合成の発想 ── あの背骨に、レンズ(lens)やオプティック(optics)と呼ばれる「双方向の部品」を据えると、ゲーム・学習・制御・強化学習が、同じ数学の上で扱えるようになる。

だから、圏論的サイバネティクスは ── 第1幕からの問い「遠く離れた分野が、同じ構造を共有している」の、もっとも射程の長い答えのひとつなんだ。

pic_39.jpg

学部生:
あの、いまサラッと「レンズ(lens)」「オプティック(optics)」と言われましたけど ── それ、何ですか?

「双方向の部品」って説明されても、正直まだピンと来ていなくて。
光学レンズとは、関係ないですよね?

講師:
これは、もともと 関数型プログラミングの道具 なんだ。
Python を書く君なら、以下のたとえで、すぐに腑に落ちると思う。

まず「レンズ(lens)」── 出発点はデータアクセス

巨大でネストした(入れ子の)データ構造を考えてほしい。
たとえば「住所」というレコードがあって、その奥に「郵便番号」というフィールドが埋まっている。

これに対して、やりたいことは2つだ。

  • 読む:住所全体から、郵便番号を取り出す(get / view)
  • 書く:新しい郵便番号を渡して、住所全体を更新したものを作る(set / update)

この「取り出す」と「更新する」をペアにして1つの部品にしたものが、レンズだ。

Python でいえば、ネストした辞書の d["address"]["zip"] を読む処理と、そこだけ書き換えて新しい辞書を返す処理を、1つのまとまりにして持ち運べるようにしたもの、とイメージすればいい。

学部生:
getter と setter を、バラバラにではなく、ペアで1つの部品にした、という感じですか。

講師:
まさにそれだ。そして大事なのは、この部品同士が合成できること。

「住所のレンズ」と「郵便番号のレンズ」をつなげば、「人物データから郵便番号まで一気に読み書きするレンズ」になる。

部品をつないで大きな部品を作る ── 第2幕からの合成の発想と、同じだ。

ここで「双方向」が効いてくる

レンズは、前向き(forward)と後ろ向き(backward)の2つの向きを持っている。

  • 前向き:入力を受けて、何かを計算して送り出す(住所 $→$ 郵便番号を取り出す)
  • 後ろ向き:結果を受けて、もとの構造に反映させて返す(新しい郵便番号 $→$ 更新された住所)

この「前に送って、後ろに返す」という双方向の形が
── 実は、機械学習の誤差逆伝播そのものなんだ。

前向きにニューラルネットが予測を計算し、後ろ向きに誤差の勾配が戻ってくる。

第2幕で触れた「Backprop as Functor」が、レンズの前向き=順伝播・後ろ向き=逆伝播として、ぴったり当てはまる。

「オプティック(optics)」は、その一般化

レンズは「データの一部分を読み書きする」という、いちばん素直な形。

これをもっと一般的にして、さまざまな種類の双方向プロセスをまとめて扱えるようにした上位概念が、オプティックだ。レンズはオプティックの一種、という関係になっている。

学部生:
だから ── データの読み書きも、ニューラルネットの学習も、ゲームのプレイも、「前向きに送って、後ろ向きに返す」という同じ形をしている。

その形を部品にしたのが、レンズやオプティックなんですね?

講師:
その通りだ。ゲームのプレイヤーも、この双方向の部品で書ける

前向きに「戦略を選んで手を打つ」、後ろ向きに「結果(利得)を受け取って評価する」
── 第2幕で見た Open Games の $X, Y, R, S$ の入出力は、まさにレンズ/オプティックの双方向の流れなんだ。

だから、レンズという小さな道具ひとつが、データアクセス・機械学習・ゲーム理論を、同じ数学の言葉でつないでいる。

圏論的サイバネティクス は、それを「双方向の部品の合成」として、まとめて扱う枠組みなんだ。

6歩目: ゲーム理論の古典的教科書

並行して、伝統的なゲーム理論も学ぶことをお勧めする。

  • Drew Fudenberg, Jean Tirole "Game Theory" (1991) ── 大学院レベルの定番
  • Martin Osborne "An Introduction to Game Theory" (2003) ── 学部レベル
  • 岡田章「ゲーム理論」(2011) ── 日本語の定番教科書

学部生:
Compositional Game Theory を学ぶには、伝統的なゲーム理論の知識も要るんですね。

講師:
Compositional Game Theory は、伝統的なゲーム理論の「再構築」 だ。古典を知らないと、何が新しく、何が改良されたのかが見えない。

ただし、本記事を読んだ程度の輪郭把握だけでも、この分野の方向性と可能性は、十分に感じ取れるはずだ。


結章 ── ゲーム理論の、新しい風景

学部生:
最後に、まとめてもらえますか?
今日の対話で、何を学んだのか。

講師:
5つに整理しよう。

この記事で得たこと1: ゲーム理論は、現代の経済学・社会科学・AI の中核言語

ゲーム理論は、経済学のノーベル賞の常連分野。
広告、金融、規制、AI、生物学 ── ありとあらゆる場面で使われている。

この記事で得たこと2: 伝統的なゲーム理論には、構造的な限界がある

「ゲーム」を一塊として扱うため、大規模なシステムや、モデルの組み合わせに弱い。

この記事で得たこと3: Compositional Game Theory は、ゲームを「プラグ」として扱う

各 Open Game は、観察・選択・結果・評価の入出力を持つ部品。プラグ同士を、圏論のモノイダル構造にそって合成することで、大きなゲームを組み立てられる

この記事で得たこと4: Nash 均衡は、圏論的な不動点として再定義される

各プラグの均衡を、独立に計算し、合成によって全体の均衡を構築できる。これにより、インクリメンタルな分析が可能になる。

この記事で得たこと5: 応用領域は、ゲーム理論の伝統的な範囲を超えて広がっている

オークション、メカニズムデザイン、マルチエージェント AI、スマートコントラクト、AI 安全性、経営・リスク管理 ── これら全てに、Compositional Game Theory の射程が及ぶ。

学部生:
すごい広がりですね。

講師:
これは、まだ研究段階の領域だ。商業的な大規模応用は、これからの10〜20年で、徐々に育っていく可能性がある。

そして ──「ゲーム」と「圏論」という、まったく無関係に見えるものが、同じ数学の骨格を共有しているという発見の深さ、そして、経済学・計算機科学・圏論論理学のクロス領域としての本気度を考えると、たとえ将来の主役にならなくても、追いかける価値のある問いだ。

学部生:
今日の対話、本当にためになりました。ありがとうございました。

講師:
こちらこそ。

── そして、最後に。

学部生:
はい。

講師:
ゲームを「閉じた完成品」ではなく、「開かれた部品」として見直す

これは、ゲーム理論だけの話じゃない。

現実の世界は、すべてが繋がっている。経済も、政治も、技術も、生態系も、AI も。

それぞれを、独立した塊として扱うのではなく、互いに接続される部品の集合として捉える視座
── これが、21世紀の知の風景の、一つの大きな方向だ。

Compositional Game Theory は、その風景の一部だ。

学部生:
世界を「合成的」に見る、ということですね。

講師:
そう。

そして、僕らの対話は、これから先、この合成的世界観の、もっと深いところまで、追及していきたいと勧化ているよ。

学部生:
今後の対話(記事)も、楽しみにしています。
ありがとうございました。

講師:
ではまた、次の研究室で。


関連する話題 ── さらに広い地図

pic_40.jpg

本記事で扱った Compositional Game Theory は、より広い「圏論的世界観」 の一部として位置づけられます。

関連する分野:

1. Categorical Probability Theory(圏論的確率論)
Tobias Fritz らが体系化している、確率論を圏論で書き直す研究。Markov Categories、String Diagrams for Probability。

2. Categorical Cybernetics(圏論的サイバネティクス)
Compositional Game Theory の上位概念。機械学習、制御理論、強化学習、ゲーム理論を統一的に扱う枠組み。

3. Categorical Database(圏論的データベース)
David Spivak らが体系化。データベース設計を圏論で扱う。スキーマ間の翻訳が、関手として扱える。

4. Categorical Quantum Mechanics(圏論的量子力学)と QNLP
本記事執筆者がすでにQiita記事で扱った領域。量子計算と自然言語処理の圏論的接続。

5. Type Theory(型理論)と関数型プログラミング
Haskell、Idris、Coq、Lean ── これらの言語の理論的基盤。Compositional Game Theory の Haskell 実装も、この系譜にある。

6. Mechanism Design(メカニズムデザイン)
オークション、マッチング、規制設計。
Compositional Game Theory が、最も実用的に応用されつつある領域。

7. Multi-Agent Reinforcement Learning(マルチエージェント強化学習)
複数の AI が相互作用する状況。Compositional Game Theory のAIへの応用の中心。

これらすべてが、**「合成的世界観」**という共通の精神で繋がっています。


Appendix ── 本文の事実関係に関する出典・補足

本記事の対話は架空の設定ですが、扱った理論・人物・応用例・年号は、すべて実在する研究や公開情報にもとづいています。

本文の流れを止めないために脚注を避け、主な根拠と補足を、ここにまとめます。

A. Jules Hedges 氏と Compositional Game Theory の研究コミュニティ

  • Jules Hedges 氏は、2024年9月時点で、活動の約90%を自ら共同設立した Institute for Categorical Cybernetics(CyberCat Institute)、約10%を University of Strathclyde に置くと自ら述べています。CyberCat Institute は2024年1月に法人化されました。
     
  • Compositional Game Theory は Hedges 氏ひとりの研究ではありません。最初の本格的な論文(LICS 2018)は Neil Ghani・Jules Hedges・Viktor Winschel・Philipp Zahn の4人の共著であり、その後も Joe Bolt、Matteo Capucci、Bruno Gavranović、Jérémy Ledent、Fredrik Nordvall Forsberg らが拡張を発表しています。
     
  • この分野は、より大きな研究コミュニティ Applied Category Theory(ACT、応用圏論) の一部です。ACT は毎年国際会議を開いており、2019年のオックスフォード大会では約70本の論文投稿・約150人の参加がありました。会議はその後も Maryland、Strathclyde、Cambridge、MIT、University of Florida(2025)と各地で続き、査読付きオープンアクセス誌『Compositionality』も運営されています。

B. ゲーム理論・オペレーションズ・リサーチの産業応用

  • オペレーションズ・リサーチ(OR):宅配大手 UPS の配送最適化システム ORION は、OR と機械学習で構築され、10億ドル超を投じて全米約5.5万台の車両に展開、年間およそ1億マイルの走行と3〜4億ドルのコストを削減したと報告されています。OR は航空会社の乗務員スケジューリング、収益管理、在庫・供給網管理など、広範な実務で使われています。
     
  • オークション設計:アメリカの電波(周波数)オークションは、Paul Milgrom・Robert Wilson らの auction theory が設計の土台であり、両氏は2020年にノーベル経済学賞を受賞しました。オンライン広告オークション(セカンドプライス型)もゲーム理論の応用です。
     
  • マッチング:Alvin Roth 氏は、ゲーム理論とマッチング理論を腎臓のドナーと患者の間のマッチングに応用し、実際の腎臓移植件数の増加に寄与しました(2012年ノーベル経済学賞)。研修医の配属先の選定や、学校の選択にも同種の理論が用いられています。
     
  • ゲーム理論は「制度・ルールを設計する道具」としては強力ですが、入り組んだ現実の駆け引きを「予測する道具」としては前提の単純化に対する批判もあり、その点は本文でも「設計に強く、予測には慎重に」と表現しています。

C. オペレーションズ・リサーチと圏論の接続

C-1. 接続の概要

  • 近年の応用圏論では、最適化問題を、入力・出力の境界を持つ「開いた目的関数(open objective)」として表し、それらを合成して大きな最適化問題を組み立てる枠組みが研究されています。
     
  • その土台となるのが ハイパーグラフ圏(hypergraph category)装飾コスパン(decorated cospan) で、これらは電気回路や線形力学系を部品から組み立てる構成にも使われてきました。
     
  • さらに、一般化された勾配降下法(gradient descent)が圏論的な関手として定式化できることも示されており、最適化の合成と勾配降下が整合することが研究されています。
     
  • なお、この最適化の圏論化(ハイパーグラフ圏・装飾コスパン系)は、Compositional Game Theory で用いる道具立て(モノイダル圏・オプティクス系)とは技術的には別系統です。本文では「同じ"部品から組み立てる"精神を共有している」という比喩のレベルで両者をつないでいます。
     
  • 補足として、「OR × 圏論」は現時点ではまだ若い領域であり、ゲーム理論における Nash(1950)のような確立した歴史的金字塔が存在するわけではありません。以下は「完成した正典」ではなく、この交差点の入口と土台になっている代表的な文献として挙げています。

C-2. 読書案内(本文で言及した文献)

入口(応用圏論全体の入門書)

  • Fong, B., & Spivak, D. I. (2019). An Invitation to Applied Category Theory: Seven Sketches in Compositionality. Cambridge University Press. (arXiv:1803.05316)

土台(「開いたシステム」を合成する)

  • Baez, J. C., & Fong, B. (2018). "A Compositional Framework for Passive Linear Networks." Theory and Applications of Categories, 33, pp. 1158–1222. (arXiv:1504.05625)

最適化問題そのものの合成(オペレーションズ・リサーチへの直接的応用)

  • Hanks, T., Klawonn, M., Hale, M., Patterson, E., & Fairbanks, J. (2024). "A Compositional Framework for First-Order Optimization." (arXiv:2403.05711)
    ── 最適化問題をオペラッドで階層的に合成し、勾配降下法や Uzawa 法を代数射として導く。最小費用流問題を例に分散的な分解アルゴリズムを自動生成。実装は Julia パッケージ AlgebraicOptimization.jl

設計最適化(co-design)

  • Censi, A. (2017). "Uncertainty in Monotone Co-Design Problems." (arXiv:1609.03103)
  • Zardini, G. (2023). Co-Design of Complex Systems: From Autonomy to Future Mobility Systems. PhD thesis, ETH Zürich.

隣接領域(最適化 × 学習)

  • Fong, B., Spivak, D., & Tuyéras, R. (2019). "Backprop as Functor: A Compositional Perspective on Supervised Learning." LICS 2019. (arXiv:1711.10455)

D. AI エージェント間プロトコル(本文 第6幕)

  • MCP(Model Context Protocol):Anthropic が2024年11月に発表した、AI とツール・データソースを接続するためのオープンスタンダード。
     
  • A2A(Agent2Agent):Google が2025年4月9日に Google Cloud Next で発表し、2025年6月(6月23日)に Linux Foundation へ寄贈され、ベンダー中立な統治体制へ移行しました。

参考文献

Compositional Game Theory の中核論文

  1. Hedges, Jules (2017). "Towards compositional game theory." PhD thesis, Queen Mary University of London.

  2. Ghani, N., Hedges, J., Winschel, V., Zahn, P. (2018). "Compositional game theory." Proceedings of LICS 2018.

  3. Bolt, J., Hedges, J., Zahn, P. (2019). "Bayesian open games." arXiv:1910.03656.

  4. Capucci, M., Gavranović, B., Hedges, J., Rischel, E. (2022). "Towards foundations of categorical cybernetics." Applied Category Theory 2021.

関連する圏論・型理論の文献

  1. Mac Lane, S. (1971). Categories for the Working Mathematician. Springer.

  2. Fong, B., Spivak, D. (2019). An Invitation to Applied Category Theory: Seven Sketches in Compositionality. Cambridge University Press.

  3. Milewski, B. (2019). Category Theory for Programmers.

伝統的ゲーム理論の文献

  1. von Neumann, J., Morgenstern, O. (1944). Theory of Games and Economic Behavior. Princeton University Press.

  2. Nash, J. (1950). "Equilibrium points in n-person games." Proceedings of the National Academy of Sciences, 36(1), 48-49.

  3. Fudenberg, D., Tirole, J. (1991). Game Theory. MIT Press.

  4. 岡田章 (2011). 『ゲーム理論』有斐閣.

Categorical Probability の文献

  1. Fritz, T. (2020). "A synthetic approach to Markov kernels, conditional independence and theorems on sufficient statistics." Advances in Mathematics, 370.

産業応用の文献

  1. Roughgarden, T. (2016). Twenty Lectures on Algorithmic Game Theory. Cambridge University Press.

  2. Hartline, J. D. (2013). "Mechanism design and approximation." Working paper.

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?