この記事は ラクス Advent Calendar 2024 の22日目の記事です。
ChatGPTを提供するOpenAIが12日連続で新機能などを発表する「12 Days of OpenAI」を実施しました。
ありがとうサム!!
12個の発表には「素晴らしいもの」「そうでもないもの」様々ありましたので
感想を含めて、まとめていきたいと思います。
それでは見ていきましょう!!
DAY 1:「OpenAI o1」と「OpenAI o1 pro」がリリース!
有料プラン向けに提供されていた高度な推論モデル「o1 preview」からプレビューが取れ、正式に「o1」としてリリースされました! また同時に「o1 proモード」というさらに高性能な上位バージョンもリリースされました。ただし、このモードを利用できるのは、月額3万円の「ChatGPT pro」プランだけ!「o1」モデルの特徴
- preview版よりも高速で賢くなった
- マルチモーダルに対応(画像や動画の読み取りが可能に)
「ChatGPT pro」プランの特徴
- 月額200ドル(約3万円)
- 各モデルへの無制限のアクセス(他プランはレート制限などがある)
- 「o1 proモード」が唯一利用可能なプラン
感想
- o1がさらに高性能になったのは純粋にうれしい!
- Proプラン高いな~と思いましたが超優秀なコンサルを契約できると思えば安いかも
DAY 2:強化ファインチューニング研究プログラムの発表
o1モデルをファインチューニングできる「Reinforcement Fine-Tuning(強化ファインチューニング)が発表されました。o1モデルは推論が特徴であり、通常のファインチューニングでは強化できませんでしたが、OpenAIも社内で使用している強化学習のための環境が展開されるという「発表」です。公開はまだ先になるようです。強化ファインチューニング研究プログラムの特徴
- o1モデルをファインチューニングできるように
- 全体リリースは来年。大学・研究者・企業向けにはプレビュー参加の方法を提供。
感想
- 一般ユーザーにとってはあまりうれしくない発表でちょっとがっかり
- 一方、研究分野ではo1を独自のドメインに特化した訓練ができるため、これまで解明できなかった病気の治療方法や化学研究などがさらに進められる可能性を秘めています。
DAY 3:動画生成AI「Sora」がついにリリース!!
衝撃的な発表から10か月、、ついに「Sora」がリリースされました! ようやく、と言ったほうがよいかもしれませんね。Soraの発表から間もなく、各社から続々と動画生成AIがリリースされ、Soraの存在が忘れられようとしたタイミングでのリリースです。「Sora」の特徴
- まずは「ChatGPT Plus」と「ChatGPT Pro」ユーザーに提供
- 特徴的な6つの機能
- 「Remix」ビデオ内の要素を置き換えたり、削除したり、作り直したりできる
- 「Re-cut」最適なフレームを見つけて分離し、前後の方向に延長できる
- 「Storyboard」タイムライン上でビデオの独自のシーケンスを整理および編集できる
- 「Loop」ループでトリミングしてシームレスな繰り返し動画を作成できる
- 「Blend」2つのビデオを1つのシームレスなクリップに結合(合成)できる
- 「Style presets」動画のスタイルを変更できる
- 「ChatGPT Plus」は最大720pの解像度、5秒間の動画が最大50本生成できる
- 「ChatGPT Pro」は最大1080pの解像度、20秒の動画が最大500本生成できる
感想
- ようやくリリースされたが、その間にリリースされていたRunwayやKling等の動画生成AIと比較して大きな優位性が見られず感動はなかった。
- 過度に安全性に配慮されているようで倫理を超えた動画は失敗する傾向にあるみたい。
DAY 4:「Canvas」機能が無料ユーザーでも使えるように!
有料プラン向けにβ版として提供されていた「Canvas」機能が正式リリースとなり無料ユーザーにも開放されました。キャンバスは別ウィンドウでプログラミングコードや文章が表示され、さらに編集などもできる便利な機能です。「Canvas」機能の新たな発表
- 無料プラン含む全プランのユーザーが利用可能に
- キャンバス内でPythonコードが実行可能に
- GPTs(カスタムGPT)でもキャンバスが利用可能に
感想
- キャンバスは本当に便利な機能なので無料プランでも使えるようになるのはうれしいですね。
- Pythonが実行可能になりましたが、他社はReactなども動かせるのでもっと他の言語の実行環境も整えていってほしいところ。
DAY 5:Apple製品(iPhone、iPad、Mac)にChatGPTが統合
Apple製品のAIエコシステム(Apple Intelligence)にChatGPTが加わりました。Siriなどを通じてChatGPTを利用することができるようになります。Apple製品へChatGPTが統合されてできること
- SiriからChatGPTを呼び出せる(ChatGPTアカウントは不要)
- iPhoneのカメラ映像を元にChatGPTへ質問できる
- ChatGPTのアカウントと連携すれば、Siriに質問した内容が連携され保存される
感想
- iPhoneユーザーにはうれしい発表ですね。
DAY 6:高度な音声モードがリアルタイムでカメラの映像を認識できるように!(おまけでサンタモードが追加)
高度な音声モード(遅延なしに会話できるモード)にリアルタイムビデオ映像を認識する機能が追加されました。過去の発表で、ビデオを通じて算数の問題を解く様子や、視覚障碍者の目となってまわりの様子を解説するデモが発表されていましたが、これが実現したかたちです。高度な音声モードに追加された機能
- リアルタイムでカメラの映像を認識することが可能に!!
- スマホの画面をリアルイムに共有することも可能。
- 期間限定のボイス種類に「サンタ」が追加。サンタクロース🎅と会話できます。
感想
- 高度な音声モード発表時のデモで注目されていたリアルタイムビデオ機能は待ちに待った機能ではないでしょうか?
- ゲームをしている様子を解説してもらったり、周りの景色から場所を割り出すなど、面白いユースケースが出てきています。
- この発表の数日前にGoogleが「Gemini 2.0」をリリースをしており、そちらもリアルタイムビデオ機能が実装されていたので、Googleに出し抜かれた感あり。
DAY 7:ChatGPTに「Projects」機能が追加!!
カスタム指示や会話履歴のセットがプロジェクトという単位で切り替えられる「Projects」機能がリリースされました。日本語だと「プロジェクト」と呼ぶのがよさそうですね。「Projects」機能の概要
- プロジェクトという単位で、チャット履歴・アップロードファイル・カスタム指示をまとめることができる
- 有料プランのユーザーに順次展開予定。
感想
- 作業によってカスタム指示やチャット履歴をまとめて切り替えられるのは便利そうです。
- アップロードしたファイルをRAGのように使えるのもよさげ。
DAY 8:「ChatGPT search」がさらに進化し、無料ユーザーにも開放!!
有料ユーザー向けに展開されていた「ChatGPT search」が無料ユーザーにも開放されました。 「ChatGPT search」はChatGPTが検索機能を持ち、会話しながら最新の情報を提示してくれるGoogleと競合する新たな検索エンジンです。「ChatGPT search」の発表まとめ
- 無料ユーザーでも使えるように
- 検索速度の向上。特にモバイルアプリでの検索速度が向上。
- 高度な音声モード内でも検索が利用可能に
- 天気、株価、スポーツ、ニュース、地図などのビジュアルデザインがリッチに
感想
- 使ってみたが、以前よりもサーチがかなり早くなった印象
- PerplexityなどAI検索エンジンを駆逐するまではいかなそう
DAY 9:「o1」モデルのAPI公開と開発者向けのいくつかのアップデート
本日は開発者向けの発表がメイン。「o1」モデルのAPI公開や「Realtime API」のアップデートと価格の値下げなどが発表されました。開発者向けの発表内容
- 「o1」モデルのAPIが公開。関数呼び出し、開発者メッセージ、構造化出力、ビジョン機能をサポート。(Tier5の利用者のみ。今後数週間で全体に展開予定)
- 「Realtime API」がWebRTCをサポート。価格の大幅な値下げ。
- fine-tuning APIが「Preference Fine-Tuning」という手法をサポート。創造的な文章作成や要約など、「より良い」応答が主観的であるタスクに効果的とのこと。
- GoとJavaのSDK(β版)が利用可能に。GoとJavaでより簡単にOpenAIのAPIが実装できるようになりました。
感想
- 開発者にはうれしい内容ですね。
- 「Realtime API」のアップデートでアプリへの実装がより簡単になり、複雑な処理も可能になるのでアプリ開発者は様々なアイデアを巡らせているのではないでしょうか??
DAY 10:電話とWhatsAppからChatGPTにアクセス可能に!
電話(米国のみ)から直接ChatGPTにアクセスできるようになりました。電話をChatGPT宛にかけるとChatGPTが会話で応答してくれます。また、WhatsApp(米国でメジャーなメッセージングアプリ。日本でいうLINE)を通じてChatGPTに質問することができるようになりました。こちらはWhatsAppを使っている人はどの国からもアクセスできます。
発表のまとめ
- 電話(固定電話含む)からChatGPTにアクセス可能に(米国のみ)
- WhatsAppからChatGPTにアクセス可能に。
感想
- 米国のみなので日本はまだ先になるか。でも、どのくらい需要あるんだろう??ネット環境がなくても使えるのはよい。ただ、そこまで切迫したユースケースもなさそう。
- 高齢者だと電話で会話できるのがよいのかも。何も用事がないのに会話したいから掛けたりとかね。独り身のご老人の救世主となるかもw
- 日本だとWhatsAppよりもLINEというイメージなので利用者は多くなさそう。日本のスマホ事情だとiPhoneもしくはAndroid端末利用者が多い事から、そもそもApple intelligenceやGeminiで十分そう。
DAY 11:デスクトップアプリ(Mac版)が「Notes」や「Notion」などのアプリと連携!
Mac版のデスクトップアプリが進化し、「Notes」や「Notion」などの他アプリの情報を直接参照できるようになりました。デスクトップアプリ(Mac版)の新機能
- 「Notes」や「Notion」上の情報を直接参照可能に。(書き込みはできない)
- 例えば、これまでは「Notes」の情報をコピー&ペーストしてChatGPTに認識してもらう必要があったが、「Notes」と連携することでChatGPTは「Notes」上の情報を参照することができるようになる。なので、プロンプトの指示がシンプルになる。
- 連携できるアプリは、「Warp」、「Notes」、「Notion」、「Quip」、「Xcode」など
- 高度な音声モードと各アプリの連携も可能に
- Windows版も近日中に利用可能になる予定
感想
- コピペ作業が大幅に減りそうなのはよいですね。
- 書き込みができるとよいのに。そのうちできるようになるか?
- 各アプリとの連携は、AIエージェント的な機能の布石か?
DAY 12:「OpenAI o3」と「o3-mini」を発表!!
12日連続発表の最終日、推論モデル「o1」の性能をはるかに凌駕する「o3」モデルを発表しました!!発表まとめ
- 「OpenAI o3」と「o3-mini」を発表(ただし、リリースはまだ先になる)
- 数学とプログラミングの能力が大幅に向上(人間のトップクラス並の性能)
- 「o3-mini」には「Low」「Medium」「High」の3つのバージョンがあり、「Low」は推論時間が短いが性能も控えめ、「High」は推論時間が長くなるが性能も高くなる。「Medium」はその中間。
- 研究者向けに安全性のテストに参加できるフォームを公開
- 「o3-mini」のリリースは来年の1月下旬を予定(o3はその後になる)
感想
- 1日目の発表が「o1」だっただけに「o3」の発表には驚いた。
- ベンチマークからしか性能がわからないが、なんかすごそう
- 各種ベンチマークのスコアを競うのはこの辺りが限界っぽい(飽和状態)。今後はAIエージェントなどより使い勝手がよくなる方向での進化が期待される。
最後に
OpenAIが12日連続で新機能などを発表する「12 Days of OpenAI」は「o3」モデルの発表で幕を閉じました。
みなさんはどの発表に心躍りましたか??
生成AIはとてつもないスピードで進化しています。このOpenAIの発表の間にもGoogleなどの競合各社からもAI関連の様々な新発表がありました。
そのような激しい競争の中、最終日の「o3」の発表は AGI(汎用人工知能)への到達の兆しを感じさせる素晴らしいものだったと思います。
2025年もOpenAIから目が離せない1年となりそうですね!!
こちらのまとめ記事が少しでもお役にたてましたら幸いです。
ハッピークリスマス🎄!!
(追記)
DAY 13:プラスユーザー向けにSoraの無制限の作成が開放!!
- 有償のPlusプランのユーザー向けにSoraでの動画作成が無制限に
- ただし、年末年始の休暇期間中のみ
- リラックスモード限定(GPUの空き時間を有効活用するモードで、少し時間がかかる)
- エンジョイ、クリエイション!!