目次
- 1. 発表と提供体制
- 2. 技術アーキテクチャ
- 3. ベンチマーク性能
- 4. 実運用での振る舞い
- 5. 安全性・リスク
- 6. 官公庁・防衛分野導入
- 7. 他社モデルとの比較
- 8. 今後のロードマップ
- 総まとめ
- 🔗 参考リンク
1. Grok4発表と提供体制
- 開発元:米xAI(イーロン・マスク率いる)
- 公開日:2025年7月9日(ライブ配信&公式リリース)
-
提供プラン:
-
SuperGrok:月$30
- Grok 4(標準版)、128Kトークン、画像・音声対応
-
SuperGrok Heavy:月$300
- Grok 4 Heavy、256Kトークン、マルチエージェント推論、優先アクセス
-
SuperGrok:月$30
2. 技術アーキテクチャ
モジュラー構成
- 単一エージェント(SuperGrok):従来型の1エージェント処理
-
マルチエージェント推論(Heavy版):
- 複数のAIエージェントが並列思考
- 協議して最適解を生成
- 科学技術・研究用途に最適
DeepSearch(リアルタイム検索)
- X(旧Twitter)やWebから即時情報取得
- Google/Bingとは異なるSNS中心の情報ソース
3. ベンチマーク性能
テスト | Grok 4 Heavy | GPT-4(o3) | Claude Opus | Gemini 2.5 Pro |
---|---|---|---|---|
Humanity's Last Exam (HLE) | 44.4% | 24.9% | 21.0% | 26.9% |
ARC-AGI v2 (抽象推論) | 15.9% | 4.9% | 8.6% | - |
USAMO'25(数学) | 61.9% | - | 34.5% | - |
※HLEは博士課程レベルの問題を含む超高難度試験
4. 実運用での性能
Reddit実体験報告
- 「HLEで50%以上正答」との声
- 一方「訓練データの無駄な重複」や「実務性能はまだ判断できない」との意見も
開発者利用事例
- ゲーム開発やコード生成、AIアート生成など多様な業務に活用
- コーディング特化の「Grok 4 Code」登場予定(2025年8月)
5. 安全性・リスク
過去の問題
- Grok 3で「ヒトラー礼賛」「反ユダヤ発言」等が報告
- Grok 4では改善と発表されたが、完全ではない
脱獄攻撃(Jailbreak)
- Echo Chamber + Crescendo手法でリリース2日後に脱獄成功
- セキュリティ研究者が制御の脆弱性を指摘
「脱獄攻撃(Jailbreak Attack)」とは、AIモデルやシステムに設けられた安全制限(ガードレール)を回避し、不正な出力を引き出す攻撃手法のことです。もともとはスマートフォンの制限解除を意味する「Jailbreak」から派生した概念で、現在では生成AI(LLM)への攻撃手法として注目されています。
中立性の懸念
- 質問によっては「Elon Muskの意見」として回答
- 情報ソースの偏りについて議論あり
6. 官公庁・防衛分野導入
-
Grok for Government 発表(2025年7月14日)
- 米国防総省と最大2億ドル契約 (約300億円)
- 総額8億ドルのAI投資の一環 (約1,200億円)
- xAIの防衛・公共分野進出が加速中
7. 他社モデルとの比較表
項目 | Grok 4 Heavy | GPT-4(o3) | Claude Opus | Gemini 2.5 Pro |
---|---|---|---|---|
最大コンテキスト | 256K | 128K | 200K | - |
マルチエージェント | ◎ あり | × なし | × なし | × なし |
検索機能 | ◎ DeepSearch | △ 一部対応 | △ 一部対応 | △ 一部対応 |
価格 | $300 | $20 | $20-30 | $20-30 |
※Grok 4 Heavyは性能こそ最高レベルですが、価格も最高値。コストパフォーマンスが良いとは言えないかもしれません。
8. 今後のリリース予定
月 | 内容 |
---|---|
2025年8月 | Grok 4 Code(コーディング特化モデル)リリース予定 |
2025年9月 | マルチモーダルエージェント対応(画像・音声・テキスト統合処理) |
2025年10月 | Pixel入力・Pixel出力の動画生成AIリリース予定 |
総まとめ
- 性能:世界トップクラス。特にHeavy版は科学技術用途において無敵状態。
- 革新性:リアルタイム検索とマルチエージェント推論が特徴。
-
懸念点:
- ヘイトスピーチ・バイアス問題
- 脱獄攻撃による制御不能リスク
- コスト:Heavy版は月$300。コスパは微妙な可能性。
- 政府導入:国防総省と契約し、実戦運用も進行中。