More than 1 year has passed since last update.

イーロン・マスクの最新AIチャットボット、ある重要な分野でChatGPTを凌駕

Posted at 2024-04-03

本記事はEntrepreneurにより翻訳されたものです。

イーロン・マスクのxAIスタートアップがGrokのAIモデルを一般公開してから約2週間、同社のAIチャットボットがアップグレードされることになりました。

同社は木曜日にGrok-1.5を発表し、その最新モデルはより長い文書を理解し、より複雑なプロンプトを処理し、より高度な推論を行うことができると主張しました。

Grok-1.5は、コーディングと数学のスキルが向上し、オリジナルの1.0からステップアップしているように見えますが、その発表の投稿によると、いくつかのベンチマークテストでは、GoogleのGemini Pro 1.5 AI、OpenAIのGPT-4、AnthropicのClaude 3 Opusに遅れをとっていますが、ある重要なHumanEvalテストではOpenAIを上回っています。

Grok-1.5は、HumanEvalベンチマークでGPT-4よりも高いスコアを獲得しました。HumanEvalベンチマークは、AIモデルのトレーニングデータには含まれていない164の挑戦的なプログラミング問題で構成されています。GPT-4のスコアは67%、Gemini Pro 1.5のスコアは71.9%、Grok-1.5のスコアは74.1%でした。

Grok-1.5は、初級から上級までの57科目の知識をカバーするMMLUテストで81.3%を記録し、Google Geminiのスコア（83.7%）に迫る成績を収めました。

また、小学生から高校生までの数学の競技問題をカバーするベンチマークであるMATHテストでは50.6%を記録し、GPT-4のスコア52.9%に迫るスコアを記録しました。
マスク氏は金曜日のソーシャルメディア投稿で、Grok 1.5は来週までにX（旧Twitter）で利用可能になるはずだと述べました。

Xのオーナーは次世代のGrokに大きな期待を寄せており、Grok-1.5の次のステップは現在利用可能なAIを「すべての指標で」上回るだろうと書いています。Grok 2は「現在トレーニング中」と彼は投稿に書いています。

Grok AIは現在、Xで月額16ドル以上のPremium+に加入している人だけが利用できます。

マスクは今月初め、xAIの競合であるOpenAIを提訴し、OpenAIにそのAIの背後にある研究と技術を公開させる判決を求めました。

以上、イーロン・マスクの最新AIチャットボットについて伝えました。ほかのAIトレンドに関心を持つ方に、低画質な画像を一瞬で高画質化するVanceAI画質向上や、最高なぼかし除去サイトを目標に働いているVanceAI画像鮮明化という二つのAI製品を試すのをお勧めします。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up