本記事は下記の続きです。
GPT-4o
2024年5月、OpenAIからGPT-4o(oはomniより)が発表された1。GPT-4oはGPT-4からさらにマルチモーダル性が高まり、テキスト、音声、画像、ビデオの任意の組み合わせを入力として受け入れ、テキスト、音声、画像の任意の組み合わせの出力を生成することができる。構造やデータセット量など、技術的な詳細は明らかにされていない。
前のGPT-4 Turboと比べて、2倍の応答速度、50%の利用料金、5倍のレート制限(利用トークンの上限が増える)、英語以外の対応力が強化されているなどの利便性が謳われている2。
Strawberry, OpenAI o1/o3
2024年7月にロイター通信から、OpenAIがStrawberryと呼ばれる新しいAIプロジェクトに取り組んでいることが報じられた3。翌8月には、GPT-4が困難な複雑な数学的問題、プログラミングタスク、長期的な計画と行動を必要とするタスクを含む詳細な研究を処理するAIの能力を強化する、コードネームStrawberryというAIモデルとして発表された(この時、OpenAIの次期主要モデルとしてOrionも挙げられた)4。そしてさらに翌月の9月には、ChatGPTでOpenAI o1-previewとしてStrawberryが公開された56(OpenAI 1を略してo1と名付けられている7)。o1(-preview)は強化学習を通じて、思考の連鎖を生成する能力を磨き、効果的に使用する方法を学習し、思考の連鎖(Chain of Thought)を利用しており、回答に思考プロセス(問題の分析、解法の模索、条件探し、傾向の分析、試す数字の選択など)が表示される68。
GPT-4oが国際数学オリンピックの予選問題で13%しか正解していないこともあり、STEM(science, technology, engineering, and mathematics)領域に対応可能なAI開発も行っているということになる9。
2024年12月、OpenAI o1(full version)がリリースされた10。o1-previewよりも大きな間違いが34%少なく簡単な問題には素早く回答できるようになっているとされている11。
また同12月(o1発表の1日後)に、改良版であるo3も発表されている(o2はイギリスの携帯通信会社の名前のためスキップされた)12。
Sora
2024年2月に、text-to-videoのAIモデルであるSora(日本語の空が由来)をリリースした1314。diffusionモデルとTransformerモデルを組み合わせたモデル(OpenAIのTechReportではこの論文が参照されている)になっており、他の同様のモデルよりも長い最長1分の動画を生成可能である。
NumByNum :: Understanding the Sora Technical Report (OpenAI, 2024)
SearchGPT, ChatGPT search
Sam Altman氏は、Web検索をGoogleが独占していることに関して、広告を含むビジネスを置き換える(Google検索のコピーではなく全く異なるものをユーザーに提供する)ことが重要であり、ChatGPTのようなチャットクライアントと検索機能の統合に興味を示していた15。
OpenAIのこのような思想もあり、2024年7月、OpenAIからAIとWeb検索の強みを組み合わせた検索機能(AI検索)であるSearchGPTのプロトタイプを発表した16。従来のGoogle検索のようなキーワード検索ではなく、対話の流れを踏まえた上で検索結果を表示できる上、追加の質問にも対応可能かつ回答の根拠となるソースのリンクも併せて提示することが可能であり、ChatGPTの課題の一つである最新情報を用いたタスク処理やハルシネーションへの対応も強化した17。
そして10月には、ChatGPT searchとしてAI検索の機能がChatGPTに統合された1819。GPT-4oをファインチューニングしたモデルやo1-previewの出力も利用したツールであり、これによりPerplexity、AI Overviews(Google)、Copilot搭載のMicrosoft BingのようなAI検索ツールをOpenAIがリリースしたことになる20。
“AI search is going to become one of the key ways that people navigate the internet, and it's crucial, in these early days, that the technology is built in a way that values, respects, and protects journalism and publishers. We look forward to partnering with OpenAI in the process, and creating a new way for readers to discover The Atlantic.”
Nicholas Thompson, CEO of The Atlantic
ChatGPT Pro
2024年12月、研究者、エンジニア向けにさらに高額な月額200ドルのプランChatGPT Proをリリースした21。