問題
弊社のイネーブリングチーム主導で、Jira チケットから実装・PR 作成までを一気通貫で自動化する仕組みが進んでいます。しかし、この仕組みにより作られた PR description や Issue の実行計画は、長い。読むのが大変です。
ただし「長い」こと自体は問題の本質ではありません。それなりの機能を1つ作ろうとすれば、説明が長くなるのは自然です。問題は 必要な長さより長い こと、そして 読んでも判断材料にならない ことにあります。
そして気づくのは、これはこの仕組みだけの問題ではないということで、手元で Claude Code 等と対話しながら書かせた PR も、同じ傾向を持ちます。AI で作りました、という文章、長いな、読むのめんどくさい、と思いませんか。私は思います。自分も同じようなことしちゃうんだけど。
コストの逆転
従来、PR を書くコストはそれなりに高く、レビューするコストはそれより低いものでした。AI が PR を書くようになって、このバランスが崩れていると感じています:
手元で対話しながら実装するコスト < 自動生成された PR を読み解いて判断するコスト
PR を作るコストが下がっても、レビュー側のコストを計算に入れると、手元で対話しながらやったほうが全体として早い、という判断が成り立ちます。
Epiplexity という概念
この問題について同僚と議論していたとき、Epiplexity という概念を教えてもらいました(Lad et al., 2025)。これが、上の違和感にぴったりはまりました。
論文によれば、データの情報量は2つの成分に分解できます。
- Entropy: 観察者にとって予測不可能なランダムネス
- Epiplexity: データに含まれる、観察者が学習可能な構造の量
Shannon の Entropy は観察者の計算能力を無限と仮定するため、データの性質だけで決まります。1MB のデータは誰にとっても 1MB です。しかし同じ本を読んでも、吸収できる量は人によって明らかに違う。Epiplexity はこの違いを説明します。論文の定義を借りれば:
計算に制限のある観察者が、与えられた計算資源のもとで認識できる、データ中の構造と規則性の量
("the amount of structure and regularity visible within the object at the given level of compute")
Entropy がデータの性質だけで決まるのに対し、Epiplexity は データと観察者の計算能力の関係 で決まります。同じデータでも、観察者の能力次第で「構造的」にも「ランダム」にも見える、というのが核心です。
日常会話で、Entropy 高いな、と言ったりしますが(しないか)、別に、計算資源を意識して発言はしてないですよね。フォローできていませんでしたが、この論文は、年始から結構話題になっていたようです。
人間の PR と AI の PR の違い
同僚との議論の中で、この枠組みを PR に当てはめてみたところ、構造的な差がはっきり見えました。
人間の PR: 高 Epiplexity / 圧縮された Entropy
- 必要な情報だけ書く
- 判断軸が埋め込まれている
- 「何が重要か」が暗黙に示される
読み手の Epiplexity に依存して成立しています。つまり、書き手と読み手の間に共有コンテキストがあることを前提に、情報を圧縮しています。
AI の PR: 情報量は大きいが Epiplexity が低い
- 情報は網羅的
- 判断の重み付けが弱い
- 構造がフラット
論文の厳密な意味での Entropy は「予測不可能なランダムネス」ですが、AI の PR は「ランダム」なわけではありません。ただ、計算資源に限りのあるレビュワーにとって「どこが重要か予測できない」フラットな文面は、実質的にランダムネスに近い負荷を読み手に与えます。情報の総量は大きいのに、そこから学べる構造(Epiplexity)の比率が低い状態です。
「AI の出力を要約させてから読む」の正体
AI が書いた長文を、別の AI に要約させてからレビューする、というワークフローがあります。結構、自分はこれをしていて、一度作らせてから、壁打ちしながら理解していくって流れですね。これは Epiplexity 的に言えば:
Entropy → Epiplexity への変換を、LLM に外注している
本質的な解決ではなく、変換コストを付け替えているだけです。
じゃあどうするか
問題は「AI が長く書く」ことではなく、「AI の出力が読み手の Epiplexity を再構築する形になっていない」ことにあります。
方向性としては:
- PR の粒度を変える: Epiplexity が低くなるほど大きな PR を書かせるのではなく、判断可能な単位に分割する
- 構成を変える: 情報共有的な(そのままの説明的な)文面ではなく、「目的 → 検討過程 → 解決策」「全体 → 詳細」のように、読み手の中に構造が再構築される順序で書かせる
- PR テンプレートを AI 時代に合わせて更新する: 従来のテンプレートは人間が書くことを前提にしています。AI に書かせるなら、Epiplexity が高くなるような構成を強制するテンプレートが要ります
論文でも、同じデータでも順序を変えるだけで学習効率が変わる(Shannon entropy は順序不変だが Epiplexity は順序に依存する)という知見が示されています。情報量が同じでも、構造化の仕方で「学べる量」は変わります。
※ 一方で、レビューがなくなる云々という話もありますが、それはひとまず置いておきます
まとめ
| 情報の総量 | Epiplexity(学べる構造の比率) | |
|---|---|---|
| 人間の PR | 圧縮されている | 高い(読み手の文脈に依存) |
| AI の PR | 大きい(網羅的) | 低い(フラットで判断材料にならない) |
| AI 要約 → レビュー | 変換コストを外注 | 本質的解決ではない |
「AI の PR が読みづらい」は、情報の総量に対して Epiplexity が低い、という問題として構造化できます。解決の方向は「短くする」ではなく、「読み手が学べる構造にする」です。
理解してみると、そりゃそうだ感もあるのですが、勉強になりました。