More than 1 year has passed since last update.

【ポエム】GPT4o (omni) と人類の仕事について（クソデカ主語） | OpenAI Spring Update

Last updated at 2024-05-14Posted at 2024-05-14

GPT4oの発表を通して思ったことを書き連ねてるだけ

一言で

小規模化やアシスタント化が謳われるAI業界で、OpenAIは「コミュ力」で勝負してきた
人類から機械に仕事が奪われる理由は、「機械でいいじゃん」という消極的なものではなく、「機械にやってほしい」という積極的なものだと感じた

~~明日Googleの発表に感激したらその記事も書きます~~
予告動画を見る限り、音声と動画での会話について今発表ではOpenAIの完全勝利になりそうですね

OpenAIは「コミュ力」で勝負してきた

昨日までの世界

昨日までの生成AI、言語モデル界隈のトレンドは、

phi3-miniをはじめとするローカル・モバイルで動くほどの「小規模化」
GPTストアやDify、そのほか様々なサービスが目指す「アシスタント化」

だったはずだ。

近頃のOpenAI・ChatGPTは、
Geminiから始まり、
Claude、
オープンソースモデル（⌘R+, mixtral, llama3）、
そんなモデルたちにそろそろ追いつかれそうというところだった。

実際私も、ChatGPTへの課金はすでにやめ、
（APIだけは残していたがそこもClaudeをより気に入りつつあり）、
ローカルで無課金でモデルを動かすことを楽しんでいた。

しかし、

OpenAIは１つ未来で戦っていた

だから追いつかれているように見えて、
蓋を開けてみたら想像もしない地点に到達していた。

chatgpt2 という匂わせはたしかにあったわけだが、
たしかに音声と動画でのライブモードは、
今までのChatGPTとはメジャーバージョンの違う「ChatGPT ver2.0」だった。

まだOpenAI Spring Updateのデモ映像を見てない人はすぐに見てほしい。
こちらの呼びかけにすぐ答え、
相手の口調を読み取り、自分の口調を変化させ、
カメラで見ながら人に物を教えるChatGPTを。

OpenAIは、

オーディオ、画像、動画を読み込める能力
桁違いの表現力を持つ音声で出力できる能力
会話のカットインをスムーズに行えるUI
明らかに速い応答

これらをひっさげてChatGPTにコミュ力を獲得させていた。
目で見て音で聞いて話せる「ChatGPT 2.0」は人類に近づいた。
（しかもモデルは速く安くなってる）

このコミュ力は、小規模化やらローカルやらアシスタントやらに目を取られていた私には全く持って想像できていないものだった。
しかし間違いなくChatGPTにはこれを求めていたという感じだ。
私はChatGPTを使う時、ツールやシステムとして使いたいというのはあくまで主目的ではなく、「Chat」したいわけだ。
それを叶える新しい形がこれだった。

ツールやシステムとしては他にもっといい選択肢がありうるのだから、
「ChatGPT」というサービスに求めることは会話であり、
そこに対する正統進化を提供してくれた。
こういうサービスの考え方は見習いたい。

それもただ「正統」なだけでなく、予想もしなかった妄想・魔法を実現してくれた。
人に驚きを与えるには、妄想や未来像を信じ抜いて実現する力が必要なのだろうと痛感した。
「あっと驚くサービスに必要なのは、改善ではなく革命なのだ」と心に刻みたい。

機械に仕事が奪われる理由は積極的な願望

去年GPT4が出た時も、「AIに仕事が奪われる」ということはたくさん言われてきたわけだ。
しかし今日まで本格的に奪われてる仕事はそうない。

少なくとも私は、「AIに仕事が奪われる」という時、
「もうGPT4でよくなるじゃん」という気持ちで言っていたと思う。
その裏には「コスト的に」とか「面倒だから」みたいな消極的な理由があったんだと、思い返して感じる。

でも本当に「仕事が奪われる」時、
こんな後ろ向きな理由では奪われないんだろうと今回感じた。

GPT4oを見た人なら、
「これもうコールセンターとかこれでいいんじゃね」
と少なからず感じたのではと思う。
実際そうなるかは別とする（実際それをやれば、それを悪用してコールセンターからGPT4oに無料でアクセスするなんてこと起きそうだし）

だが同じ「AIでいいんじゃね」でも、
去年のGPT4のときと違うなって思ったのは、
「昨今の機械的なコールセンターの対応より、感情表現豊かなGPT4oに対応してもらいたい」
という積極的に求める気持ちがそこにあったことだ。

最近のコールセンターと言えば、
「〇〇の人は１を、〜〜の人は２を、、、」
みたいな機械的な対応が多い。
それと比べた時、この感情表現豊かでこちらの感情も汲んでくれるGPT4oに感じたことは、
「もうGPT4oでいいや」から、
「GPT4oにやってほしい！」に近づいていた。

こういう「積極的に機械に代わって欲しい」と思う時、
人類の仕事は機械に奪われるのではないだろうか？
蒸気機関が普及した時も、コンピュータが普及した時も、
「〇〇でいいや」ではなく「人間より〇〇のほうがいい！」という民意に人類の仕事は奪われたのではないだろうかと感じた。
人類から仕事を取り上げるのは人類なのだろうと思う。（今のところ）

「結局シンギュラリティまだ？」と感じている気持ちの中には、
「たしかにすごいけどまだまだ」とか、
「これじゃあまだ人間に任せておきたい」とかっていう気持ちがあると思う。

これを吹き飛ばして、
「これはもう人間よりAIに任せたい！」と思わせてしまうような驚きと興奮の片鱗を、GPT4oの発表に見た。

終わりどころがわからなくなってしまったが、明日深夜のGoogleの発表も楽しみだ。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up