4
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

AI が書いた PR はなぜ読みづらいのか -- Entropy と Epiplexity で考える

4
Posted at

問題

弊社のイネーブリングチーム主導で、Jira チケットから実装・PR 作成までを一気通貫で自動化する仕組みが進んでいます。しかし、この仕組みにより作られた PR description や Issue の実行計画は、長い。読むのが大変です。

ただし「長い」こと自体は問題の本質ではありません。それなりの機能を1つ作ろうとすれば、説明が長くなるのは自然です。問題は 必要な長さより長い こと、そして 読んでも判断材料にならない ことにあります。

そして気づくのは、これはこの仕組みだけの問題ではないということで、手元で Claude Code 等と対話しながら書かせた PR も、同じ傾向を持ちます。AI で作りました、という文章、長いな、読むのめんどくさい、と思いませんか。私は思います。自分も同じようなことしちゃうんだけど。

コストの逆転

従来、PR を書くコストはそれなりに高く、レビューするコストはそれより低いものでした。AI が PR を書くようになって、このバランスが崩れていると感じています:

手元で対話しながら実装するコスト  <  自動生成された PR を読み解いて判断するコスト

PR を作るコストが下がっても、レビュー側のコストを計算に入れると、手元で対話しながらやったほうが全体として早い、という判断が成り立ちます。

Epiplexity という概念

この問題について同僚と議論していたとき、Epiplexity という概念を教えてもらいました(Lad et al., 2025)。これが、上の違和感にぴったりはまりました。

論文によれば、データの情報量は2つの成分に分解できます。

  • Entropy: 観察者にとって予測不可能なランダムネス
  • Epiplexity: データに含まれる、観察者が学習可能な構造の量

Shannon の Entropy は観察者の計算能力を無限と仮定するため、データの性質だけで決まります。1MB のデータは誰にとっても 1MB です。しかし同じ本を読んでも、吸収できる量は人によって明らかに違う。Epiplexity はこの違いを説明します。論文の定義を借りれば:

計算に制限のある観察者が、与えられた計算資源のもとで認識できる、データ中の構造と規則性の量
("the amount of structure and regularity visible within the object at the given level of compute")

Entropy がデータの性質だけで決まるのに対し、Epiplexity は データと観察者の計算能力の関係 で決まります。同じデータでも、観察者の能力次第で「構造的」にも「ランダム」にも見える、というのが核心です。

日常会話で、Entropy 高いな、と言ったりしますが(しないか)、別に、計算資源を意識して発言はしてないですよね。フォローできていませんでしたが、この論文は、年始から結構話題になっていたようです。

人間の PR と AI の PR の違い

同僚との議論の中で、この枠組みを PR に当てはめてみたところ、構造的な差がはっきり見えました。

人間の PR: 高 Epiplexity / 圧縮された Entropy

  • 必要な情報だけ書く
  • 判断軸が埋め込まれている
  • 「何が重要か」が暗黙に示される

読み手の Epiplexity に依存して成立しています。つまり、書き手と読み手の間に共有コンテキストがあることを前提に、情報を圧縮しています。

AI の PR: 情報量は大きいが Epiplexity が低い

  • 情報は網羅的
  • 判断の重み付けが弱い
  • 構造がフラット

論文の厳密な意味での Entropy は「予測不可能なランダムネス」ですが、AI の PR は「ランダム」なわけではありません。ただ、計算資源に限りのあるレビュワーにとって「どこが重要か予測できない」フラットな文面は、実質的にランダムネスに近い負荷を読み手に与えます。情報の総量は大きいのに、そこから学べる構造(Epiplexity)の比率が低い状態です。

「AI の出力を要約させてから読む」の正体

AI が書いた長文を、別の AI に要約させてからレビューする、というワークフローがあります。結構、自分はこれをしていて、一度作らせてから、壁打ちしながら理解していくって流れですね。これは Epiplexity 的に言えば:

Entropy → Epiplexity への変換を、LLM に外注している

本質的な解決ではなく、変換コストを付け替えているだけです。

じゃあどうするか

問題は「AI が長く書く」ことではなく、「AI の出力が読み手の Epiplexity を再構築する形になっていない」ことにあります。

方向性としては:

  • PR の粒度を変える: Epiplexity が低くなるほど大きな PR を書かせるのではなく、判断可能な単位に分割する
  • 構成を変える: 情報共有的な(そのままの説明的な)文面ではなく、「目的 → 検討過程 → 解決策」「全体 → 詳細」のように、読み手の中に構造が再構築される順序で書かせる
  • PR テンプレートを AI 時代に合わせて更新する: 従来のテンプレートは人間が書くことを前提にしています。AI に書かせるなら、Epiplexity が高くなるような構成を強制するテンプレートが要ります

論文でも、同じデータでも順序を変えるだけで学習効率が変わる(Shannon entropy は順序不変だが Epiplexity は順序に依存する)という知見が示されています。情報量が同じでも、構造化の仕方で「学べる量」は変わります。

※ 一方で、レビューがなくなる云々という話もありますが、それはひとまず置いておきます

まとめ

情報の総量 Epiplexity(学べる構造の比率)
人間の PR 圧縮されている 高い(読み手の文脈に依存)
AI の PR 大きい(網羅的) 低い(フラットで判断材料にならない)
AI 要約 → レビュー 変換コストを外注 本質的解決ではない

「AI の PR が読みづらい」は、情報の総量に対して Epiplexity が低い、という問題として構造化できます。解決の方向は「短くする」ではなく、「読み手が学べる構造にする」です。

理解してみると、そりゃそうだ感もあるのですが、勉強になりました。


参考: From Entropy to Epiplexity (Lad et al., 2025)

4
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?