OpenAIは「12 Days of OpenAI」と題して、12月6日から12営業日連続で新機能やアップデートを発表しています。現時点での主な発表内容は以下の通りです。
Day 1
OpenAI o1の正式リリース
- マルチモーダル対応で画像アップロードが可能に
- ChatGPTの全有料プランで利用可能
- より正確で高速な応答を実現する新しいアーキテクチャを採用
ChatGPT Proの導入
- 月額200ドル(約3万円)の新プラン
- o1 Proモードへのアクセス
- 研究者、エンジニア、AIを日常的に使用する専門家向けに設計
- 特徴
- より多くの計算リソースを使用して深い思考が可能
- 複雑な問題に対してより信頼性の高い回答を提供
- 特に以下の分野で高い性能を発揮
- データサイエンス、プログラミング、法的分析 など
- OpenAIの最先端モデルとツールへの無制限アクセスを提供
- OpenAI o1(最新のAIモデル)
- o1-mini(軽量版モデル)
- GPT-4o
- Advanced Voice1
- Advanced Voice Modeの制限解除
Day 2
強化学習型ファインチューニング
- 数十〜数千単位のタスクを処理
- 法律、保険、医療、金融、エンジニアリング分野での活用を想定
- 2025年初頭に一般公開予定
Day 3
Soraがついにリリース
- テキストからリアルな動画を生成できるAIモデル
- さまざまな形式のビデオを作成したり、リミックス、ブレンドしたりできる
- ChatGPT Plus/Proプランなどで利用可
Day 4
Canvasのベータ版公開
- ChatGPTの新しいインターフェースで、単純なチャット以上の文章作成やコーディングプロジェクトが可能
- 別ウィンドウで開き、ChatGPTとユーザーが並行して作業可能
- GPT-4oで構築され、現在ベータ版として提供中
- 文章作成機能として下記のような機能を提供
- 文章の編集提案と即時フィードバック
- 文章の長さ調整
- 読解レベルの変更(幼稚園から大学院レベルまで)
- 文法・明確さ・一貫性のチェック
- 絵文字の追加
- コーディング機能として下記のような機能を提供
- コードレビューと改善提案
- デバッグ用のログ追加
- コメントの追加
- バグ修正
- 他言語への移植(JavaScript、TypeScript、Python、Java、C++、PHP)
- 文章作成タスクでは83%、コーディングタスクでは94%の精度でCanvas起動判断が可能
- コメント生成の品質と正確性において、通常のGPT-4oと比較して精度が30%、品質が16%向上
- 使用方法
- ChatGPTが必要と判断した場合に自動で開くか、プロンプトに「use canvas」を含めること
- 特定の箇所をハイライトして編集対象を指定可能
- バックボタンで過去のバージョンに戻すことが可能
- ChatGPT Plus、Team、Enterprise、Eduユーザー向けに提供開始
Day 5
Apple Intelligence連携
- SiriがChatGPTと連携開始
Day 6
Advanced Voice Modeの機能拡張
- 「Advanced Voice Mode」に動画機能が追加され、音声とビデオを組み合わせたインタラクティブな体験が可能
- AIがリアルタイムでカメラ映像を理解し、物体や状況を認識して応答できる
- ChatGPT Plus/Proプラン向けに提供される予定
Day 7
ChatGPTのProject機能
- AIを活用した作業を効率的に管理・整理するための新しいワークスペース
- Project機能を使用すると以下のことができるようになる
- ファイルのアップロード
- アップロードしたドキュメント、画像、コードなどのプロジェクトに関連する情報にアクセスし使用できる
- カスタム命令の設定
- トーン、スタイル、希望の出力など、プロジェクトに対する特定の指示ができる
- 会話を整理
- 関連する会話をグループ化して、過去のやりとりを簡単に見つけて参照できる
- ファイルのアップロード
Day 8
ChatGPT Search機能
- ChatGPTの検索機能が全体に開放され、すべてのプラットフォームでログインしているすべてのユーザー(有料、無料)で利用できるように
- 検索がより高速になりモバイルでのエクスペリエンスが向上
- 高度な音声モードと統合され、音声コマンドでリアルタイムのWeb情報にアクセスできるように
- ブラウザで ChatGPT 検索をデフォルト検索エンジンとして設定できる
Day 9
開発者向けに複数の新モデルと新機能を発表
- OpenAI o1がAPIで利用可能に
- OpenAIのo1モデルは、複雑な推論タスクに特化した大規模言語モデル
- 特に関数呼び出し、構造化出力、コーディングのような領域で、以前のモデルよりパフォーマンスが向上
- 関数呼び出し、構造化出力、開発者メッセージ、画像理解を含む、完全な製品機能をAPIで利用できる
- リアルタイムAPIの更新
- リアルタイムAPIでWebRTCがサポートされ、リアルタイムの音声体験を簡単に構築できる
- GPT-4オーディオトークンのコストが60%削減
- APIでのGPT-4 Miniのサポートが追加
- プリファレンス微調整
- プリファレンスの新しい微調整方法がAPIで利用可能に
- 開発者は他方よりも優先される応答のペアを提供することで、ユーザーの嗜好により沿ったモデルを作成できる
- GoとJava用の新しいSDKが利用可能に
- OpenAI APIとの統合がより簡単になった
- 新しいログインとサインアップのフローが導入され、APIキーの取得プロセスが簡素化された
Day 10
ChatGPTの新しいコミュニケーション方法
- ChatGPTでは音声通話とWhatsAppの2つの新しいコミュニケーション方法が追加された
- 電話機能
- 米国の専用番号に電話することで ChatGPT と直接会話できる
- 毎月 15 分間の無料通話を受けることができる
- WhatsApp
- 世界中のユーザーが WhatsApp で ChatGPT にメッセージを送信できる
- これらのコミュニケーション方法を通じ、ChatGPT をよりアクセスしやすくユーザーフレンドリーなものに
- 電話機能
Day 11
アプリとの連携機能
- ChatGPTが他のアプリケーションと連携し、よりシームレスなワークフローを実現する機能
- ChatGPTがデスクトップ上で実行中の他のアプリケーションと連携し、テキスト、コード、データなどを直接取得できる
- ChatGPTは連携したアプリのコンテキスト(文脈)を理解し、より適切な応答や提案を生成できる
- ターミナル、IDE(統合開発環境)、ノートアプリなど、様々な種類のアプリケーションとの連携が可能
- 具体的な連携例
- Gitリポジトリのコミット履歴やコード内容をChatGPTに直接渡すことができる。例えば、「過去2ヶ月のコミット頻度を計測したい」といったリクエストに対して、ChatGPTが関連コマンドを自動生成し、ユーザーはコピー&ペーストで実行できる。
- Xcode、VSCode、JetBrains製品などのIDEと連携し、コード修正や追加コードの提案を行います。これにより、コーディング時の手戻りや検索時間を削減できる
- Apple Notes、Notion、Quipなどのノートアプリと連携し、執筆中の文書コンテキストを直接読み取り、文章のリライト、情報補足、参考文献の提示などを行える
- 具体的なメリット
- ワークフローの効率化
- アプリケーション間でのデータ移動やコピー&ペーストの手間を削減して作業効率が大幅に向上
- コンテキストに基づいた高度な支援
- ChatGPTがアプリのコンテキストを理解することで、より的確な応答や提案を生成できる
- よりシームレスな作業体験
- 複数のアプリケーションを横断して作業する場合でも、ChatGPTが中心となってシームレスな作業体験を提供
- ワークフローの効率化
- Mac版ChatGPTアプリに実装済みで、Windows版アプリも提供予定
Day 12
2つの新しい大規模言語モデル「O3とO3-mini」の発表
- o3 and o3-miniの主な特徴
- o3は非常に強力なモデルで、コーディング、数学、科学などの分野での大幅な精度向上。特に、困難な数学問題を解く能力に優れている
- o3-miniはコストパフォーマンスに優れたモデルで、o3と同等の性能をより低いコストで実現
- 新しい安全対策
- o3-miniから順次、外部の安全研究者による安全テストが実施予定
- モデルがプロンプトを熟慮し、安全性の判断を行うことで、より正確な安全境界を学習する技術が導入されている
- APIへの統合
- 関数呼び出し、構造化出力、開発者メッセージなどの機能をサポートし、開発者がより柔軟にモデルを活用できるようになる
- 今後のスケジュール
- o3-miniは2025年1月末頃に一般公開予定
- o3はo3-miniの後に一般公開予定
その他具体的な内容については、下記公式サイトをご確認ください。