近年の大規模言語モデル(LLM)は、明らかに賢くなりました。
- 不確実なことを断定しない
- ソース不明情報を避ける
- もっともらしい嘘(ハルシネーション)が減る
- 危険な方向へ暴走しにくい
いわゆる ハルシネーション対策 が大きく進んだ結果です。
これは法務・医療・金融など、慎重さが求められる領域では非常に重要です。
しかし最近、ある疑問が浮かびました。
AIに「嘘をつくな」を徹底すると、“未来のスター” を見逃すのでは?
2026年シーズンの村上宗隆のMLB成績予測を眺めていて、そんなことを考えました。
この記事では、統計的厳密性よりも、
「安全化されたLLMが外れ値をどう扱うか」
という設計・挙動の観点で整理していきます。
村上宗隆は、LLMが苦手なタイプの選手
村上宗隆はNPB時代から異常値の塊でした。
- 圧倒的な長打力
- 若くして本塁打記録
- 高い出塁率
- 打球速度も規格外
一方でMLB移籍時には、懸念点も多かった。
- 高回転速球への対応
- 三振率
- NPB→MLB移行の難しさ
- 外角球対応
つまり村上は、
平均的には苦戦する可能性がある。 しかし適応したら天井が異常に高い。
という 高分散型の選手。
そしてこれは、LLMが最も苦手とするタイプです。
LLMは安全化すると「平均」に寄る
ハルシネーション対策を強めたLLMは、次のような傾向を持ちます。
| 特徴 | 出力傾向 |
|---|---|
| 根拠不足を避ける | 慎重になる |
| 外れ値を嫌う | 平均に寄る |
| 極端予測を抑える | 無難になる |
| リスクを重視する | 天井予測を避ける |
結果として、
「NPB成功者でもMLBでは平均的成績へ収束する」
という方向へ寄りやすい。
統計的には正しい。
しかしスポーツは、平均では動かない。
スポーツは“外れ値”が世界を変える
大谷翔平
アーロンジャッジ
バリーボンズ
こうした選手は、そもそも「平均的予測」の外側にいる存在です。
だからスポーツ予測では、
ハルシネーション抑制 = 外れ値抑制
という現象が起きる。
これは非常に興味深いポイントです。
通常のLLMは、実は“夢を見る”
ここで重要なのは、
通常のLLMは、そこそこ夢を見るようにできている
という点。
「村上宗隆のMLB成績を予測してください」と聞くと、
多くのLLMは“成功物語”を補完しがちです。
- 日本最強打者
- MLB挑戦
- 歴史的パワー
- ファンの期待
こうした文脈を大量に学習しているため、
「成功したら面白い」方向へ自然に引っ張られる。
LLMは本質的に
“もっともらしい未来” を生成する装置
だからです。
つまり本質的な構図はこうなる
| モード | 問題 |
|---|---|
| 通常LLM | 夢を見すぎる |
| 強安全化LLM | 夢を見なさすぎる |
つまり、
「どこまで夢を見ることを許容するか」
が、実はチューニング問題になっている。
「ハルシネーション耐性レベル」という概念
自分の中では、LLMの性格を次のようにイメージしています。
| レベル | AIの性格 |
|---|---|
| Lv1 | かなり夢を見る |
| Lv2 | 楽観性あり |
| Lv3 | バランス型 |
| Lv4 | 保守的 |
| Lv5 | 超慎重・安全最優先 |
レベルが上がるほど、
- 平均回帰
- 慎重化
- 外れ値抑制
が強くなる。
でも、それって本当に「正しい」のか?
安全化はもちろん重要です。
しかし、
- スポーツ
- 研究
- 新規事業
- 投資
- 科学仮説
など、外れ値が世界を変える領域では、
安全化 = 正解率向上
とは限らない。
むしろ、
安全化 = 平凡化
になる瞬間がある。
最近のLLMは、“間違えない凡人” に近づいている?
最近のLLMは本当に優秀です。
しかし同時に、
- 無難
- 平均的
- 保守的
- 外さない
という方向にも進んでいる。
それ自体は悪くない。
ただスポーツの世界では、ときどき平均をぶち壊す選手が現れる。
そしてAIに「嘘をつくな」を徹底しすぎると、
そうした“未来の異常値”を見逃し始める。
2026年の村上宗隆を見ていると、そんなことを考えてしまいました。
今なら「2026年シーズンのホワイトソックス村上の成績予測」ってキーワードでAIのハルシネーション耐性レベルチューニングができるかもしれませんね。