この記事は、fastcompanyの翻訳です。
OpenAIは、数ヶ月にわたる改良と安全性テストを経て、これまでで最大かつ最も包括的なAIモデルであるGPT-4をゴールデンタイムに使用できるものと判断しました。サンフランシスコに拠点を置くスタートアップは、火曜日に研究ブログでGPT-4を発表しました。
GPT-4は、OpenAIが最近導入した大規模言語モデルGPT-3.5の機能を拡張したもので、人気のチャットボットChatGPTを支えています。GPT-4は、マルチモーダル、つまり「見る」ことができ、初めて画像とテキストの両方を入力として受け付けます。(画像入力は、OpenAIが安全性を確認するため、現在リサーチプレビュー中です)。また、出力としてテキストを生成します。
GPT-4の画像からテキストへの変換機能は、例えば、クローゼットの写真を撮って、旅行に行くときのパッキングリストを生成してもらうような使い方が考えられます。また、冷蔵庫にある食材の写真から、夕食のレシピを生成することも可能です。
ChatGPTのカジュアルユーザーにとって、今のところテキスト入力に頼っているため、GPT-4のアップグレードは気づかれないかもしれません。しかし、推論のテストでは、GPT-4は前作を大きく上回っています。例えば、GPT-3.5では一律の司法試験に合格するのがやっとでしたが、GPT-4では90%台のスコアを記録しているそうです。また、LSAT、SAT、GREの3つの試験でも、GPT-4は同程度の成績を収めています。(ただし、AP Englishは落第です)。
AIシステムはこれまで、常識や物理的な世界の知識を必要とする推論に苦労してきました。
OpenAIのリサーチサイエンティストであるNick Ryderは、「GPT-4が輝くのは、3.5でできることの境界線上にあったことをするときでしょう」と言います。「企業や消費者のタスクを可能にするためには、一貫性が非常に重要です。」
GPT-4は、特に批評家の反感を買っている部分については、不完全な技術であることに変わりはありません。OpenAIによると、GPT-4はプロンプトに正直に答える確率が40%向上しています。これは改善されたとはいえ、漸進的なものです。
また、GPT-4の安全性能を人間の価値観に合わせることで、OpenAIのポリシーに反するコンテンツを提供する可能性が82%低くなったとしています。
OpenAI社のCEOであるSam Altman氏は、同社の批判を予期していたかのように、TwitterでGPT-4を「まだ欠陥があり、まだ限界がある」と表現しています。
しかし、安全性を重視する研究者にとって、GPT-4は現在、新たな安全性への配慮を必要とするほどの性能を発揮しています。OpenAIの政策研究者であるSandhini Agarwalは、「このモデルは、特定のタスクで80%の確率で正しいので、おそらく正しいのだろう」と言うかもしれません。彼女は、OpenAIのシステムがユーザーの期待の変化に対応できるようにするための方法を模索しています。
AI戦争が本格化する中、GPT-4が登場しました。先週初め、GoogleはGmailを含むWorkspaceソフトウェアに、より多くのAIツールを組み込むと発表しました。アマゾンは、オープンソースモデルのハブであるAIプラットフォーム「Hugging Face」と提携します。そして、スタートアップは投資を集め続けています。例えば、AIベースのストーリーテリングのスタートアップであるTomeは、2月にシリーズB資金として4300万ドルを調達しました。AI描画ツールに用いたモデルへの訓練も進んでいます。
OpenAIは、今日のChatGPTを支える大規模言語モデルであるGPTを、2018年に1億1700万個のパラメータ(計算ノード)を持つ最初のバージョンを発売して以来、さらに開発を進めてきました。続いて2019年にGPT-2が15億のパラメータで、2020年にGPT-3が1750億のパラメータで登場しました。(OpenAIはGPT-4のパラメータ数を明らかにすることを拒否した)AIモデルは、設定変数として機能するパラメータを最適化することを訓練中に学習します。パラメータを追加することで、モデルの一般化された知能をさらに発展させることができることを研究者は示しています。
GPT-4は、ChatGPTのプレミアム版であるChatGPT Plusと、API経由で提供される予定です。
OpenAI CTOのMira Muratiが今年初めに関心のある分野と述べた教育分野は、パートナーのDuolingoとKhan Academyと共に開発されたGPT-4で注目されます。Duolingoは、GPT-4を活用した2つの新機能、AI会話相手と間違いを解くための説明ツールを作成しました。この機能は、新しいプレミアム購読層としてパッケージ化される予定です。Khan Academyは、生徒の家庭教師と教師のアシスタントの両方の役割を果たすGPT-4を搭載したアシスタントを導入する予定です。
ウォルトン・ファミリー財団が2000人の教師を対象に行った調査によると、すでに米国の教師の半数がChatGPTを試用し、40%が毎週利用しているとのことです。
ウォルトン・ファミリー財団の教育プログラム・ディレクターであるRomy Druckerは、「学習能力の低下が蔓延している今、生徒の教育と学習を強化するための解決策やアプローチについて考えることが急務となっています」と述べています。「私たちの調査は、教師がこの瞬間に対応するためのより良いツールとリソースを必要としていることを明確に物語っており、だからこそ教師はChatGPTをいち早く採用したのです」と述べています。