OpenAIがこのホリデーシーズンに仕掛けてきた「12 Days of OpenAI」、初日の動画からいきなり盛りだくさんでビックリしました。何が始まるのかと思ったら、“o1” という新モデルと、その上位に “o1 Pro モード” が追加されるなんて、ほんと容赦ないですね。
この記事はChatGPT Advent Calendar 2024の6日目です(空いていたので書いてみました)今年は「12 Days of OpenAI」ということで毎日発表がありましたが、その内容を復習しながらまとめます
o1 はどこがすごいの?
まずは普通の(?)o1のお話から。もともと GPT-4.0より高性能な「o1 preview」というのを試験的に出していたのですが、今回ついに正式版 “o1” がリリースされました。何が変わったかというと、以下のように性能面でがっつり底上げされているそうです。
- 頭脳面がさらにアップ: 数学コンペや高度なQ&A能力が向上して、コードを書くにも計算するにも頼りになる。
- 速度面も大幅に改善: o1 preview は「考えすぎか!」ってくらい反応が遅いときもあったけど、今回のo1はサクサク返ってくる。
- マルチモーダル対応: テキストだけじゃなくて画像も理解できるようになった。手書きの数式とか、写真でアップした資料でも、「これってどういうこと?」みたいに聞くときに便利。
これらのアップデート、ユーザーのフィードバックをたっぷり取り入れたらしく、動画中でも「お前らがこうしてほしいって言うから全部やったよ!」みたいに開発陣が嬉しそうに話してました。まぁ、待望の機能が詰まってるわけですね。
ちなみに個人的には、o1 preview のときの「単に“Hi”って言っただけで10秒ぐらい考え込む」という挙動がなんだか愛嬌あって好きでした。AIが人間味を出してるというか、たかが挨拶なのに無駄に悩む感じがなんとも…(笑)。でもスピードが上がるのはやっぱり正義です。
o1 Pro モードってさらに何が違うの?
そしてもう一つの目玉が、月額200ドルの “ChatGPT Pro” プランに含まれる o1 Pro モード。
「さらなる高みに行きたい…!」というパワーユーザーのために用意された特別なモードらしく、難易度高めの数式やプログラミング、さらに複雑な推論が必要なタスクで真価を発揮するとのこと。動画内で見せていたデモでは、化学や生物系のかなりニッチな問題を解かせていて、回答を出すまでに1分とか2分もじっくり考えたりしてたんですね。それこそ研究者やエンジニア向けの超ヘビーユースに耐えるモデルという印象でした。
動画での説明を聞いていると、もう「普段使いはo1で十分だよ、でもどうしても解けない問題があればo1 Proモードに投げよう」みたいな住み分けになりそう。ゲームとかでも必殺技ゲージを溜めてドーンとぶっぱなす感じに近いかも…勝手にそんなイメージを抱きました。
画像で数式を解いてくれるデモがすごい
動画内で個人的に興味深かったのが、宇宙空間にデータセンターを置いた場合の放熱面積をどう計算するか、という超ニッチな問題を手書きメモの写真を読み込ませて解かせるデモです。宇宙だと空気や水の対流冷却が使えないので、放射熱冷却を前提にするらしいんですが、「何度で運用するか」みたいなパラメータが曖昧でもo1は勝手に補完して計算してくれる。ざっくりとした結果はサンフランシスコ市の2%ぐらいの面積が必要、というオチでした。宇宙に1ギガワット級のサーバー群置こうなんて、どんだけロマン溢れてるんだ…とツッコミたくなりますが、モデル自体はきちんと計算しているのがすごいですね。
開発者向けの今後の展開も期待大
今回の「Day 1」動画では、さらに「o1 APIも準備中だよ〜」とチラッと触れられていました。
「画像もAPI経由で扱えるようになる」とか「機能呼び出しやら構造化出力やら」ができるらしく、開発者としてはたまらないアップデート。ChatGPT上で便利になった機能が、APIを通じて自分のサービスに組み込めるようになると、かなり幅が広がりますよね。ツール類が整ってきたら、もはや簡単なアプリ構築ならコード書かなくてもチャットでやり切れちゃう気もします。
いやはや、初日から動画15分弱の中に情報満載で、さすがOpenAIというか勢いが止まらない感じ。この先また新機能が出たら、自分の環境でも試してみようと思います。引き続き追いかけていきたいテックニュースの一つですね。気になる方は、ぜひ動画をチェックしてみてください。
参考動画: OpenAI o1 and o1 pro mode in ChatGPT — 12 Days of OpenAI: Day 1 - YouTube