ChatGPT登場後のAI領域の取り組みの変化を考える
皆さんが使っているChatGPTですが、この技術が登場したことによる変化を考えてみました。人それぞれ色々な意見があると思いますし、全て正解だと思います。一個人のポエムとして受け止めてもらえればと思います。
単語の意味は特に説明を載せていないので、知っている前提で書いています。初見の単語は調べてくださいませ。
はじめに
最初に、私は、いくつかの企業でデータサイエンティストとして働き、色々なデータと格闘しながら統計学、古典的機械学習、ディープラーニングと戯れ、時にはKaggleで徹夜をして過ごしていました。そこに必要なのは、データを見て、データを理解し、そのデータが生まれる背景に思いを馳せ、あらゆるテクニックを用いてモデルを構築し、顧客と会話し、ゴールを探す力です。
様々なデータと遊んできました。製造データ、気象データ、人事データ、自動車データ、医療データ、介護データ、エネルギーデータなど、様々です。画像もあれば、文章、映像、音声、テーブルデータなど、多種多様です。それぞれに特徴があり、アプローチも異なります。
データと遊ぶ前には、そもそも何を解くべきかを考えることが大事ですし、解き方や仮説を考えることも重要です。顧客とコミュニケーションをとり、方向性を擦り合わせながら、結果を提示し、時にはゴールを再定義し、取り組みを進めていました。これ自体はいつの時代も変わらない必要なスキルだと思います。
次から、ChatGPTが登場したことによる変化を考えたいと思います。
変化について考える
とりあえず絵にしてみました。一番上はタスク、その下にデータを並べています。
今の基盤モデル、特に大規模言語モデル(LLMs)は文章データでの成功が大きいと思います。まるで人間のように、人間以上に流暢に話します。続く単語を予測する、というモデルの性質が今までのデータとラベルを変換するモデル(正しい呼び方ではありません)では一定のデータが必要だった領域で、Few-Shotに必要な数サンプルで成立するという画期的な成果を生み出しています。
もちろん画像も扱えます。画像をベクトルに変換し、続いて文章ベクトルを入力し、続く単語を予測すれば良いです。画像と文章のコンテキストを捉えて文章を生成します。様々な実験動画がアップされています。なんでもできそうに見えます。
映像も生成します。ただ、映像の領域はまだ難しい部分も多いです。2時間前のあの伏線を最後の1分で回収する、なんていう芸術的な作品を作るのは人間の得意分野だと思います。今の基盤モデルはそこまで長い文脈を扱うのは難しいからです。これはある程度時間が解決するとは思いますが、それでも人間に分があると思います。
LLMsの可能性は無限だと思います。特に成功しているのは文章だと思います。複雑に見えていた "言語" は、大量のデータを学習することによってその概念を獲得し、多岐に渡る応用ができています。それは、言語が意外と画像、映像、テーブルデータなどより狭い空間だったのかもしれないと思っています。言語は日本人なら日本語で、誰もが日本語という同じ言語で会話しています。私生活でも仕事でも、日本語は日本語です。そこまで環境が変わると劇的に変わるものでもないです。一方で、画像、映像はどうでしょう。環境が変わるとあまりにも違います。森、海、工場、銀行、何もかも違います。テーブルデータも同じくです。
今までの領域はどうなるのか
そもそも今までの領域なのか、というのは置いといて、企業が抱えるユースケースは様々です。製造している製品の傷を見つけたい、場所と大きさも知りたい。安全のために弊社の社員がヘルメットを被っているのか知りたい。過去の傾向を元に電力需要を知りたい。明日は晴れかどうか知りたい。おにぎりが何個売れるのか知りたい。色々あります。
LLMsは便利です。みんなプロンプトを頑張っています。それで出来ることも多いですし、今まで出来なかったことが、ちょっとした呪文を唱えるだけで出来たりします。でも今はそこまでです。プロンプトで得られるスキルは極端に言うと日本語力と思っています。残りの人生を過ごすには物足りないスキルです。課題を特定し、適切に問題を設定し、ステークホルダを巻き込み、データと人と対話する。モデルの構築が必要な場合は、どの手段が適切かを検討し、選び、試行し、結果を見て考察する。その一連の流れが大事です。LLMsは当然ながら手段です。
他の領域は変わらず残ります。LLMsで明日の東京港区のあるコンビニのおにぎりの売り上げが分かったら、もうその時はその時です。データサイエンス、AIを嗜む我々は、問題解決能力と、適切な手段を選ぶ力、データを価値に変える力を磨くという今までと変わらないところが本質なんだと思います。その手段の一つとして、とてつもなく強力な武器が増えたのだと、そういう理解です。
これから
これから、ディープラーニングがもてはやされ、幻滅され、社会に定着していった流れをLLMsも辿ると思います。その速度は前回より早いかもしれません。そして、その間にまたブレークスルーが起きると思っています。Transformerもまた、新しい技術で置き換わるんだろうなと。そして、その速度があまりにも速い。時代の流れについていけない個人も企業も多数出てくると思います。
楽しい時代に生まれたなと思います。