LoginSignup
0
0

イーロン・マスクの最新AIチャットボット、ある重要な分野でChatGPTを凌駕

Posted at

本記事はEntrepreneurにより翻訳されたものです。
QQ20240403175442.png

イーロン・マスクのxAIスタートアップがGrokのAIモデルを一般公開してから約2週間、同社のAIチャットボットがアップグレードされることになりました。

同社は木曜日にGrok-1.5を発表し、その最新モデルはより長い文書を理解し、より複雑なプロンプトを処理し、より高度な推論を行うことができると主張しました。

Grok-1.5は、コーディングと数学のスキルが向上し、オリジナルの1.0からステップアップしているように見えますが、その発表の投稿によると、いくつかのベンチマークテストでは、GoogleのGemini Pro 1.5 AI、OpenAIのGPT-4、AnthropicのClaude 3 Opusに遅れをとっていますが、ある重要なHumanEvalテストではOpenAIを上回っています。

Grok-1.5は、HumanEvalベンチマークでGPT-4よりも高いスコアを獲得しました。HumanEvalベンチマークは、AIモデルのトレーニングデータには含まれていない164の挑戦的なプログラミング問題で構成されています。GPT-4のスコアは67%、Gemini Pro 1.5のスコアは71.9%、Grok-1.5のスコアは74.1%でした。

Grok-1.5は、初級から上級までの57科目の知識をカバーするMMLUテストで81.3%を記録し、Google Geminiのスコア(83.7%)に迫る成績を収めました。

また、小学生から高校生までの数学の競技問題をカバーするベンチマークであるMATHテストでは50.6%を記録し、GPT-4のスコア52.9%に迫るスコアを記録しました。
マスク氏は金曜日のソーシャルメディア投稿で、Grok 1.5は来週までにX(旧Twitter)で利用可能になるはずだと述べました。

Xのオーナーは次世代のGrokに大きな期待を寄せており、Grok-1.5の次のステップは現在利用可能なAIを「すべての指標で」上回るだろうと書いています。Grok 2は「現在トレーニング中」と彼は投稿に書いています。

Grok AIは現在、Xで月額16ドル以上のPremium+に加入している人だけが利用できます。

マスクは今月初め、xAIの競合であるOpenAIを提訴し、OpenAIにそのAIの背後にある研究と技術を公開させる判決を求めました。

以上、イーロン・マスクの最新AIチャットボットについて伝えました。ほかのAIトレンドに関心を持つ方に、低画質な画像を一瞬で高画質化するVanceAI画質向上や、最高なぼかし除去 サイトを目標に働いているVanceAI画像鮮明化という二つのAI製品を試すのをお勧めします。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0