初めに
2022年ごろから生成AIは加速度的に進化を果たしてきました。ChatGPT・StableDiffusionの登場に始まり、3Dモデル生成、動画生成と進化はとどまるところを知りません。
また同様にメタバースも2020年に入ってからバズワードとなり、Facebookがmetaに名称を変更したことは記憶に新しいです。
しかし、AIとメタバースを組み合わせたサービスはあまりありません。なぜでしょうか?
本記事では、現状のメタバース・AIの課題を確認し、それらの問題が解決されるであろう未来にどのような世界が広がっているか考えていきたいと思います。
本記事でのメタバースはVRChat/cluster/Resonite/VketCloudなどのプラットフォームを指し、AIについては生成AIを指すものとします。予めご了承ください。
メタバースの課題
さて、今のメタバースにはどのような問題があるでしょうか?個人的には、次の3つが大きな課題だと考えます。
- 同時接続性の課題
- 没入感の低さ
- 創造の難しさ
それぞれについて詳しく見ていきましょう。
同時接続性の課題
現状のメタバースプラットフォームで安定して接続できる人数はどのくらいでしょう?
私が触ったことのあるプラットフォームの中では一番多くて100人前後でした。また、この同時接続性はできることとトレードオフの関係にあるので自由度では逆転するでしょう。自由度と接続人数をうまく両立できるようにしないといけません。
没入感の低さ
没入感にはグラフィックやフルトラッキングなどの要素が不可欠ですが、これは高いマシンスペックや高級な機材が必要になり未だ限界があります。また、VRで入ることを考慮するとさらにマシンスペックを要求されるため、PCの性能が飛躍的に向上しない限り解決は厳しいでしょう。
創造の難しさ
現在メタバースのワールドを作るにはUnityやBlenderを使用して作業する必要があり、高度なスキルが必要になります。一般人がこれらを使いこなすことは厳しく思い通りのアバターやワールドを自ら作り出すことはできず、第三者のものを利用するしかありません。
AIの課題
さて、メタバースの課題についてみてきましたが、AIの課題にはどんなものがあるでしょうか?
メタバースとの連携に焦点を当てると次の二つがあると思います。
- 推論時間
-
マシンスペック
ひとつづつ見ていきましょう。
推論時間
今のAIは非常に強力ですが、その分、リアルタイムでの処理には限界があります。特に高品質なAIほど推論時間が長くなることが問題です。メタバース内でリアルタイムにインタラクションを行うためには、AIの推論速度が大幅に改善される必要があります。
マシンスペック
AIの処理には高いマシンスペックが必要です。多くのAIモデルは大規模な計算能力を要するため、一般的なユーザーがこれらのAIをリアルタイムで使用するのは困難です。サーバーサイドで動かすにしても限界はあります。
制約がなくなった未来のメタバースとAI
メタバースとAIの課題について述べさせていただきましたが、これらの制約がなくなった世界を考えてみましょう。
レディープレーヤーワンの世界が来たと仮定します。
- グラフィックは実写レベルで映画に入った様
- 接続人数は不明ですが1000人単位で入っていそうな表現があります
映画『レディ・プレイヤー1』より 最終決戦の様子
ここに写っているキャラはすべてプレイヤー
- フルトラッキング・アイトラッキング・フェイシャルトラッキングでの没入感
- 何なら触覚スーツもある
また、AIもプレイヤーのマシン上でリアルタイム推論が出来るようになると仮定します。
画像生成やChatGPT等の文章生成AIが瞬時に結果を返してくれるようになるでしょう。
ではそのような世界ではどのようにAIがメタバース上で利用されるでしょうか?
ユーザーが自在にワールドを想像する?
Metaが2022年に公開したデモ動画では、音声でAIを使って簡単にワールドを作れる未来を見せてくれました。このデモでは、おそらく事前に用意されたアセットを使っていたのでしょうが、未来ではこのアセット自体もAIが自動で生成してくれるようになるでしょう。
実際に、数秒で3Dモデルを生成できるAI技術もすでに登場しています。
https://ja.stability.ai/blog/introducing-stable-fast-3d
これにより、モデリングやプログラムができなくても、誰でも簡単にテキストや音声を使って、自分だけのワールドを自由に想像して作り上げることができるようになるはず。
望んだ世界が構築される?
自由にワールドを作れるようになると書きましたが、もしかしたら 「ワールドを作る」という考え自体が、将来的には必要なくなるかも? しれません。たとえば、「こういう世界で遊びたいな」と思うだけで、AIがそのイメージをキャッチし、瞬時にワールドを自動生成してくれるかもしれません。NPCすら自動で生成され会話を出来るようになるかも?
これなら、行きたいワールドを探したり、無くて落ち込むこともありません。
ユーザーはただ楽しむだけで済むのです。
すでに関連する技術も登場しています。
プロシージャル生成
No Man's Skyという2016年のゲームでは、すべての惑星が自動生成されており、プレイヤーはそれらを自由に探索できます。このゲームでは、宇宙船やNPC、クエストまでが自動生成されています。未来のメタバースでは、このプロシージャル生成技術がさらに進化し、AIが地形や建物、人々が交流する空間まで自動で作成するようになるでしょう。
NPC
没入感を高めるためには、NPCの存在が欠かせません。しかし、従来のゲームでは、NPCは決められた台詞しか話せず、リアルな交流は難しいものでした。ところが、NVIDIAがAIを活用して、プレイヤーとリアルタイムで対話できるNPCを開発しています https://www.youtube.com/watch?v=psrXGPh80UM
未来のメタバースでは、NPCがまるで人間のように自然な会話をし、プレイヤーと同じ空間で共に過ごすことができるようになるでしょう。そして、もはやNPCと実際の人間の区別がつかなくなるほどリアルになるかもしれません。
現状は
現在のところ、AIとメタバースの融合はまだ発展途上にあります。MetaのデモやNVIDIAのAI NPCなど、いくつかの革新的な試みが行われていますが、これらはまだ限定された環境での実証段階です。しかし、AI技術が急速に進化していることを考えると、これらのアイデアが実現するのはそう遠くない未来かもしれません。
それと同時にマシンスペックの向上も必要です。今以上のスペックがVRゴーグルなどのデバイスに入るくらいではないと厳しいでしょう。
終わり
色々書いてみましたが、このような世界がいつ来るかはわかりません。
例えば5年前のAI関連の技術水準は今よりもずっと低く、顔だけのアニメキャラを生成するのも一苦労でした。
ところが今では、AIが生成したと見分けるのも困難な画像を生成することが出来ます(色々な問題もついてきましたが...
映画「レディープレーヤーワン」の世界は2045年だそうです。なんと今から約20年後、意外とすぐなような気もします。あと20年でどこまで進化するか分かりません、もしかしたら技術が頭打ちになるかもしれないし、もっと発展してよりすごい未来が来るかもしれません。生きているうちにお目にかけたいものです。
間違っても「マトリックス」の世界が来ませんように
※この記事はChatGPT等の生成AIを用いて作成されました