起こりそうなこと
1. LLMサービスの価格競争
すでに始まったけど、DeepSeek-V3のようにGPT-4o並みの賢さで、10分の1の価格で提供し始めました。
ディスカウント期間が過ぎても、DeepSeekの方が圧倒的に安いです。
考えられる理由としては、AI訓練手法の進化で、同じ性能のモデルを訓練するための時間とコストがかなり減少しました。
直近だと、USD 450でo1-previewと同性能のモデルを訓練したという研究もありました。
2024年はOpenAI一強の状態も維持できなくなってきたので、今年はさらに価格競争までありそうでしょう。もちろんLLMチャットのサービスだけではなくて、その周りの応用・SaaSも同じく低価なサービスがたくさん出てくるでしょう。
2. 多様なAIエージェント
これも少しずつ出てきているけど、特に最近プログラミング界隈で流行っているClineシリーズ・さらにGoogleのGoogle Agentspaceもあって、いろんな領域でタスク自動化のAIエージェントが今年からたくさん出てきそうですね。
もちろんオープンソースの部分も注意しなくてはいけなくて、Difyもすごいけど、最近ai-agents関連のレポジトリが多く出てきて、RAG + マルチモデル + 音声・画像インプット対応 + PDF対応なども1個のアプリで完結できます。
3. 新アーキテクチャを用いるLLMモデルの台頭
GPT-4が出たほぼ2年経ったけど、そこまでGPT-3 -> GPT-4みたいな飛躍的な進化が見えてなくて、GPT-5もまだ紙上の空論みたいな状況になっています。
最近のモデルを見た感じで、Transformerモデルはそろそろ限界に来ているかと思うかもしれないでしょうか。
実は研究領域でTransformerアーキテクチャ以外のモデルもかなり進んでいます。例えばState Space Modelsは、GPTらが苦手な数学もできます。
また、LLMと少し違う概念のLCM(Large Concept Models)、「言語」よりもっと抽象的な「概念」を推論するモデルについての論文も最近流行っています。
GPTみたいなビジネスでも応用できるレベルまではもう少し時間がかかりそうですが、多くのリソースと研究者が進んでいる中で、おそらく今年も台頭しそうな感じがあります。
起こらなさそうなこと
逆に敢えて起こらなさそうなことも予測しましょう。
1. o3の流行
OpenAIからの公式情報ではなくて、あくまでリーク情報だけど、高性能バーションのo3は1回の推論でUSD 1,000(150,000円)ぐらいです。
賢さはあるけど、そこまでコストをかかってo3を使うよりは、人を雇った方が安いでしょう。
補足:こちらで言いたいのは、o3だけが流行しないではなくて、いわゆるこのような大量のリソースを使っうreasoningモデルは、賢くても、コストが高すぎて、まだ実用的なものではないと予想します。
2. GPT-5の誕生
前にも述べたけど、Transformerモデルはそろそろ限界という憶測で、OpenAIがGPT-5を訓練するために多大なリソースを投入したけどそれでもまだできないというニュースも何回聞いたことがあります。
OpenAIは次世代AIモデル「GPT-5」の開発で次々と問題に直面しておりコストが膨らんでいる
ということで以上です。予測結果の答え合わせは来年にやりましょう。