本記事はEntrepreneurにより翻訳されたものです。
イーロン・マスクのxAIスタートアップがGrokのAIモデルを一般公開してから約2週間、同社のAIチャットボットがアップグレードされることになりました。
同社は木曜日にGrok-1.5を発表し、その最新モデルはより長い文書を理解し、より複雑なプロンプトを処理し、より高度な推論を行うことができると主張しました。
Grok-1.5は、コーディングと数学のスキルが向上し、オリジナルの1.0からステップアップしているように見えますが、その発表の投稿によると、いくつかのベンチマークテストでは、GoogleのGemini Pro 1.5 AI、OpenAIのGPT-4、AnthropicのClaude 3 Opusに遅れをとっていますが、ある重要なHumanEvalテストではOpenAIを上回っています。
Grok-1.5は、HumanEvalベンチマークでGPT-4よりも高いスコアを獲得しました。HumanEvalベンチマークは、AIモデルのトレーニングデータには含まれていない164の挑戦的なプログラミング問題で構成されています。GPT-4のスコアは67%、Gemini Pro 1.5のスコアは71.9%、Grok-1.5のスコアは74.1%でした。
Grok-1.5は、初級から上級までの57科目の知識をカバーするMMLUテストで81.3%を記録し、Google Geminiのスコア(83.7%)に迫る成績を収めました。
また、小学生から高校生までの数学の競技問題をカバーするベンチマークであるMATHテストでは50.6%を記録し、GPT-4のスコア52.9%に迫るスコアを記録しました。
マスク氏は金曜日のソーシャルメディア投稿で、Grok 1.5は来週までにX(旧Twitter)で利用可能になるはずだと述べました。
Xのオーナーは次世代のGrokに大きな期待を寄せており、Grok-1.5の次のステップは現在利用可能なAIを「すべての指標で」上回るだろうと書いています。Grok 2は「現在トレーニング中」と彼は投稿に書いています。
Grok AIは現在、Xで月額16ドル以上のPremium+に加入している人だけが利用できます。
マスクは今月初め、xAIの競合であるOpenAIを提訴し、OpenAIにそのAIの背後にある研究と技術を公開させる判決を求めました。
以上、イーロン・マスクの最新AIチャットボットについて伝えました。ほかのAIトレンドに関心を持つ方に、低画質な画像を一瞬で高画質化するVanceAI画質向上や、最高なぼかし除去 サイトを目標に働いているVanceAI画像鮮明化という二つのAI製品を試すのをお勧めします。