2
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

月3ドルでClaude Code並みの性能!GLM4.7の衝撃!

2
Last updated at Posted at 2026-01-23

Claude Code正直高いと思っているすべての開発者に捧げるオープンソースの秘密兵器

こんにちは!私は日々新しいAIの情報にアンテナを張っていたのですが中国からDeepSeekやGenSparkに次ぐ軽量な生成AIのモデルが誕生しました!それがGLM4.7です。以下がその説明になります!

最新のChatGPTと同じくらい、一部ではそれを凌駕するパフォーマンスをたたき出し、さらにオープンソースなので無料で自分のローカル環境で試すことすらできてしまいます。

image.png

似ている感じのGLM4.7が試せるGLM CHATというサービスがあり、そこで試すことができます。体感でいうとChatGPTくらいのスピードです。コードを書かせてみるとその場で実行できるGeminiのGemのようなものもついてきます。

こちらがGLM CHAT、ちゃんと日本語で問い合わせれば日本語が返ってきます。

image.png

こちらが作ったアプリ、UIもまあまあ洗練されています。ほぼ1回のプロンプトから短時間で「すぐ動かせるレベル」のコードを作ってくれます。

image.png

以下はYouTube動画から抜粋した内容となっております。

GLM 4.7ってどんなモデル?

GLM 4.7は、中国のZAIが提供するコード特化型の大規模言語モデルで、年額29ドルという非常に安い価格で提供されています。
開発元は「SWE-benchで73%」と主張しており、AnthropicのClaude Sonnet 4.5と同等クラスのコーディング性能をうたっています。

価格と利用上限のポイント

  • 入門プランでは
    • Claude Code:5時間ごとに10〜40プロンプト
    • GLM Coding:3ドルで約120プロンプト
      と、大きな差があると説明しています。
  • より高い料金帯では
    • Claude:月200ドルで5時間ごとに最大800プロンプト
    • GLM:30ドルで最大2,400プロンプト
      という比較が示され、「年間29ドルのプランはかなり割安」と評価されています。

ベンチマークと技術的な改善点

  • 4.7は新しいアーキテクチャではなく、ポストトレーニング(追加学習・チューニング)による改善が中心。
  • Claude Code向けに特に最適化されており、この環境でのコード生成・補完性能が重視されています。
  • SWE-benchだけでなく、「Humanity’s Last Exam」のような難度の高いベンチマークでも、比較的良いスコアを出していると紹介されています。

また、MCPツール(外部ツールと連携するための仕組み)も3つ用意されており、APIキーを設定することで、モデルとは別に利用できるようになっています。


UI生成テストの結果

  • テスト内容
    • 「AIコードレビューサービス」のLPデザインを、バニラJSベースで生成させる
    • デザインロジックや構成要素を指定し、見た目や発想力を比較
  • 結果
    • Claude:全体的にバランスの良いUIで、デザイン言語にも合っている。
    • GLM 4.7:デザイン自体は悪くないが、テキストの長さを考慮せずレイアウトが崩れる箇所があり、絵文字の多用など、細かい部分で好みが分かれる、とコメントされています。

Next.jsプロジェクトでのコード品質

  • 条件
    • 既存のNext.jsプロジェクトに、Framer Motionやshadcn/uiなどが事前インストール済み
    • バックエンド接続を前提に、「今はモックデータで実装し、後から差し替えやすい構造」を明示的に指示
  • 使い勝手の違い
    • GLM 4.6では、コード生成が非常に遅く、Claude Code内で「思考のログ」が見えないなどの問題があったが、4.7では思考ログが見えるようになり、この点は改善されています。
    • それでも4.7は依然として生成が「かなり遅い」と感じられ速度面はまだ弱点とされています。

実装してみると以下の違いがありました。

  • UIの見た目
    • Claude:依然としてデザイン面では優勢で、視覚的な完成度が高い。
    • GLM 4.7:デザインはやや劣るが、価格を考えれば十分許容範囲という評価。
  • コードアーキテクチャ
    • GLM 4.7:モックデータを1ファイルにまとめ、そのファイルだけ差し替えればバックエンドに切り替えられるような構成になっており、「アーキテクチャ面ではむしろ優れている」と高評価。
    • Claude:各コンポーネントごとに個別importしており、あとでバックエンドに変えるときに、複数ファイルを1つずつ修正する必要が出る設計だったと指摘されています。

4.6から4.7で何が変わった?

  • 4.6の課題
    • 極端な遅さ
    • 指示から外れたコードを書き始めるなど、かなり手動で軌道修正が必要だった
  • 4.7での改善
    • Claude Code内での“思考”表示が追加され、モデルが何を考えているか分かりやすくなった
    • コードアーキテクチャや基本的な品質が大きく向上し、ベンチマークの数字に説得力が出たと評価しています。

一方で、4.7にも次のような癖が残っています。

  • コンテキスト内で「このフォルダに実装して」と書いてあるのに無視して、新しいNext.jsアプリを勝手に作り始めるなど、文脈を取りこぼすことがある。
  • 完全自律的に任せると、変な方向に進むことがあるため、ユーザー側での「誘導」や「レビュー」はまだ必須。

結論:誰におすすめ?

  • GLM 4.7は「コード品質とアーキテクチャ面でかなり優秀」で、価格を考えると非常にコスパが高いモデル。
  • 年29ドルのプランは、すでに月20ドルのClaudeプランを持っている人から見ても「誤差レベルの出費」であり、サブとして契約する価値が十分あると推奨しています。
  • ただし、「完全自律のフルオートコーディング」を任せられるレベルではなく、あくまで人間がレビュー・修正しながら使う“強力なアシスタント”として位置づけるのが現実的だとしています。

今後もGLM4.7を使って色々やっていこうと思います。

2
4
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?