中国AIの最強の一撃!智譜がGLM-4.5を発表、次世代モデルでOpenAIを標的とする
智譜の次世代フラッグシップ「融合大モデル」GLM-4.5は、推論、コード、エージェント機能を統合し、ネイティブエージェントモードを実現。このモデルは高いコストパフォーマンスと生成速度を誇り、フルスタックエージェント開発、ウェブコンテンツ作成、PPT生成など多機能に対応し、実際のパフォーマンスは驚異的。
GPT-5はまだ影も形もないが、国産モデルはすでに「融合大モデル」で衝撃を与えている!
智譜は「静かに」最新フラッグシップモデルGLM-4.5をリリース。これは新たな「融合大モデル」で、エージェント・ファウンデーション・モデルを主軸に据えている。
他のモデルが「パラメーター競争やランキング争い」に走る中、GLM-4.5は異なる路線を選択しました——流行に流されず、内輪競争を避け、直接「GPT-5を標的」に据えました!
GLM-4.5はARC(Agentic/Reasoning/Coding)能力を融合し、推論、プログラミング、エージェント能力をネイティブに統合し、より汎用性が高く、効率的なAI形態を目指しています。
体験リンク:https://chat.z.ai/
GPT-5もoシリーズ、GPTシリーズ、エージェント能力の融合を計画していると噂されていますが、オルトマンは延期を繰り返す中、私たちに「先を越された」形です。
注目すべきは、OpenAIが6月25日に「智譜」を公然と挑発し、記事『Chinese Progress at the Front』で「智譜」(DeepSeeekではなく)をグローバルな競合相手として挙げた点です。これは誰もが予想しなかった展開です。
これも智譜がOpenAIの発展を脅かす存在になったことを示しています。
公開挑発を受けた以上、智譜は控えめな態度を捨てた。この最新モデルでo3を倒す!
最近、GPT-5がWebDev Arenaで「龍蝦」という匿名ユーザーによるテスト版が存在すると暴露されました。テスト結果が驚異的だとされ、同じプロンプトで左側がGPT-5が生成したページ、右側がGrok 4バージョンで、確かにGPT-5が生成したページの方が「クール」に見える。
しかしGLM-4.5で実測したところ、この「融合モデル」は異常な強さを示し、同じプロンプトで「二連抽」の効果はSSR級!
この効果はインタラクティブなページであり、画面表現力と複雑さはGrok 4を遥かに超え、GPT-5と肩を並べるレベルです。
プロンプト:神経ネットワークまたは脳のようなグラフ構造の驚異的なインタラクティブアニメーションを作成してください。芸術的な色、滑らかなトランジション、美しいビジュアルを使用し、ページは生き生きとし、没入感があり、印象的なもので、ボタンは不要で、スクロールまたは連続アニメーションのみです。息をのむような作品にしてください。
GLM-4.5で様々なテストを実施したところ、止まらなくなってしまいました。この2日間は完全にハマっています!
GLM-4.5はウェブサイト作成だけでなく、ワンクリックでPPTを生成でき、さらに「Full-Stack全栈機能」を追加し、オンラインエージェントを実現。タスク完了後のソースコードも直接ダウンロード可能です!
開発者にとって、たった2行のコードでGLM-4.5を現在最も人気のコードツールClaude Codeにスムーズに統合できます。
これで高価で不安定なClaude APIを捨て、高性能で格安のGLM-4.5を体験できます。
さらに!智譜はGLM-4.5のリリースに本気です!「智譜クレイジーマンデー、Vで50支払えば、APIを無制限に利用可能!」お早めにご利用ください!
毎回生成される結果は予想を遥かに超えています!
さらに非常に高速で、タスクの「トークン」生成速度が圧倒的に速いことが実感できます。
特にこのモデルは、まるで「任督二脈」が開通したかのように、「エージェント、推論、コード能力」のすべての能力が融合したような感覚です。
まるで1つのモデルで、Claude Code+Manus+Reasoning Modelのすべての能力を同時に持つようなものです。
OpenAIのChatGPTのように、毎回どのモードを選ぶ必要はありません。
これが未来のAIのあるべき姿です。AIはアイアンマンの「ジャイブス」のように、ただチャットするだけで済むべきです。
GLM-4.5を使用する最も直接的な感想は、本当に強力です!
模擬飛行体が地球から火星へ飛ぶ過程は、宇宙力学の「ホーマン転移軌道」(Hohmann transfer orbit)に従って構築されています。
このプロンプトは、当時多くのユーザーがGemini 2.5、Claude、Grokで試しても実現できなかったものです。
このページではモデルの最新のFull-Stack全栈能力を活用し、まさにオンラインエージェントとして機能しています。これが真のVibe Codingです!
モデルの汎用性を総合的に評価するため、智譜は最も代表的な12のベンチマークを選択しました。具体的には、MMLU Pro、AIME24、MATH 500、SciCode、GPQA、HLE、LiveCodeBench、SWE-Bench、Terminal-bench、TAU-Bench、BFCL v3、BrowseCompです。
総合平均スコアにおいて、GLM-4.5は世界モデル第3位、国産モデル第1位、オープンソースモデル第1位を達成しました!
「より多くの」能力を融合し、最高の性能を実現
GLM-4.5が「融合」を主要な方向性として選択した理由は?
すべての大型モデルの目標はAGIの実現ですが、AGIの定義については学界で統一された見解はありません。
第一原理から考えると、既存の能力を損なうことなく、より多くの汎用的な知能能力を融合できることは、確実に一つの方向性です。
GLM-4.5はこの理念を初めて完全に実現したモデルです。
GLM-4.5初めて単一モデル内で推論、コード、エージェントなど複数の能力をネイティブに融合:
GLM-4.5はAgentic Codingの盲検テストで国内最高成績を達成
GLM-4.5は推論、コード、エージェント総合能力(平均スコア)においてオープンソースのSOTAを更新
GLM-4.5は混合専門家(MoE)アーキテクチャを採用し、
GLM-4.5:総パラメーター数355B、活性化パラメーター数32B
GLM-4.5-Air:総パラメーター数106B、活性化パラメーター数12B
GLM-4.5は「thinking」(推論強化)と「non-thinking」(汎用生成)の2つの作業モードをサポートし、推論能力と汎用応答効率を両立させます。
GLM-4.5のパラメーター数はDeepSeek-R1の1/2、Kimi-K2の1/3ですが、複数の標準ベンチマークテストでより優れた性能を発揮しています。
これはGLMモデルのより高いパラメーター効率に起因します。
GLM-4.5-Airは106Bの総パラメーター/12Bのアクティベーションパラメーターで重要な突破口を開き、Artificial Analysisなどの推論ベンチマークでGemini 2.5 Flash、Qwen3-235B、Claude 4 Opusなどの大規模モデルを凌駕し、性能で国産上位3位に入っています。
SWE-Bench Verifiedなどの評価指標において、GLM-4.5シリーズは性能/パラメーター比のパレート最前線に位置しており、同じ規模においてGLM-4.5シリーズが最良の性能を実現していることを示しています。
速度とコストパフォーマンス、国内SOTA
GLM-4.5シリーズはAPI呼び出しコストと生成効率でも突破口を開きました:API呼び出し価格は入力0.8元/百万トークン、出力2元/百万トークンと、主流モデルよりも大幅に低価格です。
さらに、高速バージョンは実測で生成速度100トークン/秒を超え、低遅延・高並列処理の実際の展開要件に対応可能です。
ただし、現在の新しいモデルの評価スコアは参考程度で、真の性能は実測で確認する必要があります!
例えば、上記の「模擬飛行体が地球から火星へ飛行し、現実世界の物理法則を完全に遵守する」というテストでは、前端コードのみを実装したモデルのほとんどは一度で完了できません。
まず、GLM-4.5には現実の物理パラメーターを考慮させず、完全な運動経路をデモさせます。
GLM-4.5はすぐに理解しました!
GLM-4.5は飛行体が火星へ向かうデモプロセスを描き、2つの視点を提供しました。
一つは全体視点です。
もう一つは「第一人称視点」で、飛行体と共に地球から火星へ飛ぶ体験が可能です。
GLM-4.5はさらに親切にも、飛行体の後ろに「噴火する尾炎」を描き加えました。これは本当に素晴らしいです!
しかし、これは単なるデモに過ぎません。もし飛行体を実際の飛行通りに構築したい場合はどうでしょうか?
ここでFull-Stack!を選択する必要があります。
Full-Stackを使用すると、GLM-4.5は完全なアプリケーションを構築できます。
同じプロンプトを使用しても、フルスタック機能を使用すると、単なるフロントエンドのウェブコードを書くよりもはるかに堅牢な結果が得られます。
このスケールは、広大な宇宙に対する私たちの認識とほぼ一致しています。一隻の飛行体が孤独に火星へ向かう姿です。
フルスタック機能を選択すれば、このプロジェクトの全ソースコードを取得できます!これはまさにCursorのようなものですね!
重要なのは、これらすべてが無料かつオープンソースである点です!
Claude Codeとのシームレスな連携
GLM-4.5のコード生成能力は極めて高く、Anthropic APIと互換性のあるエンドポイント経由でClaude Codeと統合できます。
たった2行のコードで、GLM-4.5をClaude Codeの駆動に利用できます。
方法は非常に簡単です。
まず、智譜オープンプラットフォームのAPIキーを申請します。
アドレス:https://open.bigmodel.cn/usercenter/proj-mgmt/apikeys
Claude Codeをインストール後、以下の2行のコードを実行します。
exportANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic exportANTHROPIC_AUTH_TOKEN="your bigmodel API keys"
この画面が表示されれば、使用可能です。
最も一般的な貪欲蛇ゲームを使用して、GLM-4.5をコアとしたClaude Codeの性能をテストします。
一度の対話調整後、GLM-4.5は提示要件に完全に一致する非常にインパクトのあるゲームを生成しました!
ゲームはグラフィックが美しく、スコア計算も正確で、得点後に自然なアニメーション効果も表示され、非常に驚異的です。
AI PPT:ワーカーの最高の「パートナー」
今回のGLM-4.5には、もう一つ驚かされた機能があります。
それがこのAI PPT(AI Sliders)機能です!
実際のテストでは、他のエージェントでPPTを作成する感覚とは全く異なります!
以下の例はデフォルトの設定で、他のエージェントの単一テンプレート背景とは異なり、全体の色合いとスタイルが独自に設定されています。
作成したPPTはワンクリックで公開でき、誰でも共有可能です。
PPT生成後、ワンクリックで公開可能
テストでは、1枚のイメージをアップロードするだけでGLM-4.5が「画像から内容を推測」し、例えばこの抽象的な「ウルトラマン+ロブスター+GPT-5」を組み合わせたカバー画像を生成しました。
最終的に生成されたPPTプレゼンテーション
GLM-4.5は画像内の情報を正確に把握し、検索エンジンを呼び出して内容を補完しています。
「遊び心のある」テストコードの能力から「真剣な」PPT作成まで、GLM-4.5は期待を遥かに上回っています。
使用時の最大の感想は「シルクのような滑らかさ」で、ほぼすべてのタスクがスムーズに実行され、複数回の試行も不要で、ほぼすべてのタスクを効果的に完了できます。
さらに、GLM-4.5はモデル内にARC能力(Agentic / Reasoning / Coding)を統合しているため、ほぼすべての問題は「現在のチャットボックス」内で解決可能です。
例えば、GLM-4.5に一時的に生年月日計算機を作成させることができます。
ARCとFull-Stack能力の組み合わせにより、日常のニーズを直接製品化でき、自分用だけでなく共有することも可能です。
大規模モデルの「軍拡競争」は現在、耳にするモデルだけで両手では数え切れないほど増えています。ChatGPT、Gemini、Claude、Qwen、DeepSeek、GLM、Kimi…
OpenAIのChatGPTはさらに複数の名前を付けています:GPT-4.1、GPT-4.5、o1-pro、o3、o3-pro、o4-mini。…本当に手も足も出ない状況です。
しかし、多くのモデルはAIが「人間のためにサービスを提供する」という本来の目的を忘れ、ランキング競争に走っています。例えばMetaのLlama 4の失敗は、ランキング操作のスキャンダルが原因でした。
今回、智譜GLM4.5とOpenAI GPT-5は「心照不宣」の形で、ともに「融合大モデル」路線を採用することを決定しました。
ランキング競争や意味のない命名ゲームから離れ、真にAGIを追求する原点回帰です。
智譜が指摘するように、実際の体験はランキングよりも遥かに重要です。
現在、GLM-4.5のAPIはオープンプラットフォームBigModel.cnで公開されており、Claude Codeフレームワークとの一鍵互換が可能です。また、智譜清言(chatglm.cn)とZ.aiでフル機能版を無料で体験できます。
ユーザー:
https://docs.z.ai/scenario-example/develop-tools/claude
体験アドレス:
https://chat.z.ai/
https://chatglm.cn
GitHubリポジトリ:
https://github.com/zai-org/GLM-4.5
モデルリポジトリ:
HuggingFace:
https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b
ModelScope:
https://modelscope.cn/collections/GLM-45-b8693e2a08984f
また、智譜は実測した52問の問題とエージェントの軌跡を公開し、業界の検証に供しています。
エージェントの軌跡:
https://huggingface.co/datasets/zai-org/CC-Bench-trajectories
参考資料:
https://chatglm.cn/
https://chat.z.ai/
https://glm45.org/