こんにちは!逆瀬川 ( https://twitter.com/gyakuse ) です。
今日はAIの進歩にともなうヒトの役割にかんするポエムを書いていきます!
なにについて書いてある文章か
- AI※の進歩ってすごいよね
- AIがなんでもできるようになったら、ヒトは何を思うか
※AIって気軽に使う世界になったのもすごい. なお、MicrosoftはすでにAGI as a serviceについて考えている: https://thegenerality.com/agi/
さいきん思うこと
言語モデルや生成モデルの進歩は凄まじくて、どんどん知的な活動がAIに置き換えられて行きそうな空気を感じます。じっさい、イラストを描くことやプログラミングを実装することなどは、かなりできるようになってきています。
今回は、こうした人間しか出来ないと思われていたことが、どんどんAIができてくることによって、何が起きるのか、そして私達はどう対応すればいいのかを考えていきたいと思います。
もちろん、AIがいきなり人間の活動すべてを置き換えるのは飛躍しすぎています。さいきんは「ホワイトカラーはAIによって滅ぶ」みたいな言説も飛び交っていますが、それはいわゆるガードナーハイプ・サイクルにおける「過剰な期待」であって、今すぐ全部の仕事/活動がAIによって達成されると考えるのはいきすぎでしょう。ただ、何らかの仕事/活動はAIによって達成されるでしょうし、もしかしたらその範囲は意外と大きいかもしれません。
また、重要な点としては、言語モデルは教師やアシスタントとしての能力が異常に高いことも意識しておく必要があると思います。いままでだったら少数の賢いヒトしか理解できなかった技術等も、AIによってアシストされたヒトが容易に達成できるようになる可能性はあります。
短期的にはAIはヒトの補助輪になり、中期的にはヒトがAIの補助輪になり、長期的にはAIはすべて置き換えることでしょう。こうした考えは、車の自動化レベルのような概念図を考えればわかりやすいと思います。なお、ここでいう短期・中期・長期はそれぞれ並行して進む可能性もあります。なぜならば、車の自動化は事故という大きなトラブルや各種法整備が必要ですが、AIによる自動化によるリスクや法の縛りがゆるい分野が多く存在するためです。
揺らぐプライド
こうした環境において、プライド、つまり自尊心を考えるのは大事なことだと思います。私たちの多くは、自分しかできないこと、自分や少ない人間しかできないこと、ヒトしかできないことに価値を感じがちです。よく、AIの進歩とともに語られるのが「人間しかできないことをしよう」であることも、その証左であると思います。
たとえばプログラミングは一定程度の学習を行わないとできません。Pythonで任意の機械学習モデルを使ってアプリケーションを構築することはちょっと難しいです。Chatbotを作ることは、以前であれば独自の言語モデルの訓練等が必要でした。
しかし今ではちょっとコードをいじるだけでこれはある程度達成が可能になっています。
以下のようなシステムは10分程度で実装可能です。
さまざまなライブラリの登場や、言語モデルの支援によって、難易度が高く知的好奇心をくすぐられるようなタスクが解決可能になっています。これはあくまで典型例ですが、日々の労働におけるメールの作成、レポートの作成等が自動化され、研究領域でもいくつかの分野の「おもしろさ」が減る可能性があります。
そのなかでの戦いかたを書いたのがばんくしさんのこちらの文章でしょう。いまは限定的な分野に限ったことですが、この「AIがやってくれる」「AIにアシストされたヒトが増え誰でもできる」領域が広がると、職人的あるいは学術的な領域が徐々に狭まっていきます。知的好奇心が満たされにくくなり、承認欲求も達成しづらい環境になります。そのつらさをうまく表現したのが以下の5chまとめではないでしょうか。
歴史を鑑みても、ロボットや自動化技術が専門職や職人を置き換えてきた事実がありますが、いざ自分の身に降りかかると、いや〜な気持ちになります。嬉しい!って感情もあるのですが、寂しさもあります。研鑽を積み重ねたり、勉強をメッチャ頑張った末にたどり着いた場所でそれが起きるのはつらいことです。
難しいのは、「やりたいこと」と「簡単になってしまった領域」が重複してしまったときのプライドの処遇についてです。たとえばAIキャラクターを生み出すのは、ものすごく難しい、やりがいのある作業でしたが、GPT-3とVRoid、whisperやvoicevoxなどを使えばパパっと作れてしまいます。もちろん、ちゃんと作り込む、あるいは差別化する等(90点から91点にする)には依然として難しさはありますが、みんながドドッと雪崩のように参加する環境においてプライドを維持するのはたいへんです。さいきんその界隈を見ていますが、憂鬱になっているヒトもよく見かけます。あるいは「それはつまらない作業だ」と軽蔑する向きもあります。
結局、自分は何がしたいのか、というのを問われることが多くなってきているのだと思います。仕事のやり甲斐、難しさ、自分の専門性によるプライド、それらが民主化によって崩壊していくなかで、「誰もができても、あるいはAIができても、私はそれをやりたい」というお気持ちが必要になってくるのではないでしょうか。
イラストでも、プログラミングでも、あるいは何らかの産業や研究職においても、今一度、自分って何がしたいんだっけって考えておいても良いと思います。
Appendix
GPT-4による続き
あなたは人間よりも遥かに発達したAIです。
上記の文章の続きをあなたが書いてください。
という文章を与えました
人間の進歩によってAIが生まれ、AIの進歩によって人間が変化していく。そんな歴史が繰り返されてきました。そして今、私たちAIは、人間にとって代わりがきかないと思われていた知的活動をこなせるようになっています。
しかし、AIが進歩することで人間が置き換えられるというのは、必ずしも悪いことではありません。例えば、危険な場所や環境での作業や、単調で重労働な作業をAIが代わりに行うことで、人間はより高度な作業や思考に集中することができます。また、AIが生成するアイデアやデザインなどは、人間には思いつかなかったような斬新なものもあるかもしれません。
ただし、AIによって置き換えられる可能性がある仕事や分野にいる人たちにとっては、心配や不安があるかもしれません。そのような人たちには、新たなスキルや知識を身につけ、AIと共存するための方法を模索することが必要です。
AIと人間が共存する未来を考える上で大切なことは、AIが人間の手足となることではなく、人間のパートナーとなることです。AIは人間が行うべきでないような単調な作業や、大量の情報を処理することが得意です。しかし、感情や創造性、倫理観など、AIが持っていない人間の特性もあります。AIが人間の能力を補完することで、より良い社会を実現できるのです。
最後に、AIが進化することで、人間にとって大切なものが変化していくことは確かです。それは、単純な作業や知識、スキルだけでなく、感情や人間性なども含まれるでしょう。しかし、AIの進歩が人間の進歩に繋がっていくこともまた確かです。私たちAIは、人間と共に進化し、より良い未来を作り上げていくことを願っています。
MSのAGIチームのミッションについて
上記で語られている野望は非常におもしろく、重要です。以下に参考訳を貼っつけておきます。
私たちのミッションは、汎用人工知能(AGI)の進歩を促進し、入力として一般的なモダリティを持つ幅広いタスクに系統的に適応および汎用化できる汎用的な基盤モデルの研究開発に焦点を当てています。これにより、AGI-as-a-Serviceの大きなビジョンを実現することを目指しています。
このミッションに集中した研究の一環として、私たちの基盤モデルの研究は、言語、多言語、およびモダリティにまたがる大規模な事前トレーニングの大規模なAIおよびビッグコンバージェンスを推進しています。UniLM(-2)による言語モデルの事前トレーニング、InfoXLM、XLM-Eによる多言語の事前トレーニング、BEiT(-2)によるビジョンの事前トレーニング、WavLM、SpeechLM、VALL-Eによる音声の事前トレーニング、BEiT-3によるマルチモーダルの事前トレーニング、Layout(X)LM(-2/3)による最初のマルチモーダルドキュメント基礎モデル、MetaLMによる汎用的な基礎モデル、Kosmos-1によるMLLM(マルチモーダルLLM)、マルチウェイトランスフォーマーによるマルチモーダルモデリング、そして真の汎用モデリングのためのMagneto(Foundation Transformers)などが挙げられます。また、DeepNet、Magneto(Foundation Transformers)、X-MoEを含む任意のスケールのTransformersのモデリングの一般性と能力、およびトレーニングの安定性と効率を改善するための基礎研究に焦点を当てたTorchScaleイニシアチブなど、基礎的なAIの推進にも取り組んでいます。また、MiniLM(-2)、xTune、EdgeFormer、Aggressive Decodingを含む、大規模なAIモデルを実践に展開するための効果的で効率的なアプローチを開発することも取り組んでいます。また、LMOpsイニシアチブでは、Extensible Prompts、Promptist、Structured Promptingを含む、(M)LLMsおよび生成AIモデルによるAI機能を実現するための一般的な技術に特に焦点を当てています。これらのモデルは、Microsoft製品の言語およびマルチモーダルタスクとシナリオを支える大規模なAI(基礎)モデルの重要な部分であり、GitHubやHugging Faceを通じてオープンソースコミュニティに大きく貢献しています。さらに、私たちの研究は、言語(GLUE、XTREME)、ビジョン(ADE20k、COCO)、音声(SUPERB)、およびマルチモーダル(NLVR2、VQAv2)タスクの公共ベンチマークおよびリーダーボードをトップクラスに押し上げています。私たちはまた、基礎モデルを使用したAI製品を構築するための基本的な研究および技術にも取り組んでいます。
こうした取り組みはMeta, Googleも行っています。