1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

2025年LLM業界予測の答え合わせと2026年の予測

Last updated at Posted at 2026-01-03

概要

去年1月に「2025年LLM(大型言語モデル)業界で起こりそうなことを3つ予測」を投稿して、おかげさまでたくさん見てくれました。

この1年間もいろいろあったけど、ぜひ2025年予測の答え合わせと今年の予測もしたいと思います。早速答え合わせから行きましょう。

2025年予測の答え合わせ

起こりそうなこと

LLMサービスの価格競争 → ◯

2024年と少し変わるけど、2025年は価格を直接下げるではなく、新しいモデルの小型をリリースして、前の世代と同じ賢さだけど価格は何分の一みたいなビジネスモデルになってきました。

sch1.png
横軸は価格で、右に行くほど安い、縦軸は賢さ

例えば、GPT-4.1からGPT-5 miniの圧倒的に賢くなって+安くなりました。Geminiも同じ傾向がありました。

さらにOSS(メモリが必要なので無料とは言えない)でもSOTA並の結果で、小さなOSSモデルでもそこそこ精度が高くなっています。

総括的に言うと、一般的な利用シーンにおいては以前と比べて、推論コストはそこまで気になる程度ではないことになってきました。


多様なAIエージェント → ◯

あまり説明がいらないかもしれないけど、複雑なAIアプリを構築する場合はエージェントが不可欠な存在になりました。

定量的に測ると、「ai-agents」のリポジトリ数(https://github.com/topics/ai-agents)
を見ていきましょう。2025年1月時点(画像1枚目)では459に対して、2026年1月時点(画像2枚目)では6,086となります。

sch2.png

sch3.png


新アーキテクチャを用いるLLMモデルの台頭 → △

一時期dLLMなどのアーキテクチャも出てきたけど、しかし2025年末までにも特に大きな進展がなかったようです。

超大手企業が利益追求のせいかもしれなくて(OpenAIも)、すぐに売れるTransformerを用いるLLMモデルへの投資が集中しすぎるではないという声も出て始めました。

2026年は経済予測もあまり良くないので、新アーキテクチャの研究も進まない可能性があるでしょう。

起こらなさそうなこと

o3の流行 → X

「o3」シリーズが出た時にも話題になったけど、当時には他のモデルと比べると遥かに賢いけど、計算コストがあまりにも膨大しすぎです。

sch4.jpeg

そのあとに新しい訓練手法を用いたモデルが出てきて、今のGPT-5.2はだいぶo3より賢くなりました。

sch5.png


GPT-5の誕生 → △

誕生はしたけど、OpenAIの説明により、GPT4みたいな新しい独立のモデルではなく、複数のモデルを統合する形になったようです。

そしてGPT-5が出たときに古いモデルを使わせなくて、一時期ユーザーからの不満もあったけど、OpenAI側の妥協やその後GPT-5.1と5.2が出て、今のGPT-5.2のパフォーマンスもだいぶ良くなったので、ユーザーからの不満もなくなったようです。

2026年の予測

起こりそうなこと

Transformerの進化まだ終わらない

12月ごろにGemini 3 Flashが出たけど、驚いたのはSWE-bench点数がGemini 3 Proより高かったことです。Google側によると、Proと別の新しい訓練手法を使った理由で精度が飛躍的に高くなりました。同じ手法を今後もProの方に入れるともちろんProの方の精度もさらに高くなるでしょう。

同時に、中国発のモデルもどんどん新しい訓練手法を取り込んで、引き続きSOTAモデルに近い精度まで近づいているので、おそらく2026年もまだ賢いモデルがたくさん出られるようです。


簡単にエージェントやMCP構築できるつよつよライブラリ

少し予測というよりは願望かもしれないけど、現時点でAIエージェントのライブラリが多くて、そして中には非常に複雑なかつ特殊な書き方となっていて、頑丈なエージェントを作成するためにかなり時間がかかります。

もちろんAWS Bedrock AgentCoreを活用したり、クラウドサービスの協力でエージェントを作成しても良いけど、エージェントを作る需要が高くなっているので、今年はより使いやすいフレームワークやライブラリが出てくるでしょう。


ハルシネーションの減少

実務的にどうなのかはユースケースによりますが、分析や統計結果から見ると、去年半ばまでの時点での最強モデルでも実は嘘をつくことがまだ多いです。2025年後半の方がようやく少し改善が見えてきました。

sch6.png
0は正解と間違いが半々、0以下は嘘や間違いの方が多い

良いハルシネーション(Positive Hallucination)は創造性に繋げられるとも言われますが、ビジネス世界ではほとんどのユースケースも信頼性を求められるので、2026年も引き続きこの領域の改善を期待しています。

起こらなさそうなこと

過去2年と同じ程度のコストダウン

メモリ不足の影響は去年の11月頃に殺到して、そして最悪なのはしばらく解消できなさそうです。メモリと直結するグラフィックスカードももちろん、RTX 5090が2026年に75万円まで値上がりする可能性が出てきます。

メモリ以外に電力不足もだんだん話題になってきていて、このままだと、新しいモデルの訓練や既存モデルの運用ももちろん影響が出るので、今年は大幅なAIモデルコストダウンがないでしょう。


世界モデル x LLM

「AIの父」ヤン・ルカンが新会社を設立し、世界モデルの研究に集中することを12月に発表されました。彼の話によると、現状のLLMだけでは不十分で、ワールドモデルが必要と主張されました。

ただし前述のメモリ不足にも関係があるけど、経済の景気も悪くなる中に、本当のリリースはまだ時間がかかるでしょう。

最後

以上、また来年答え合わせをしましょう。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?