LoginSignup
1
0

1. 概要

image.png
テキストプロンプトを入力としてお部屋のレイアウトを3Dメッシュでテクスチャまで生成する技術を提案している。事前学習としてテキストと画像をペアにしたモデルを採用しており、異なるカメラ視点からの見かけを合成して出力することで、3次元シーンの再構成を実現している。シームレスな3Dシーンを生成するために、単眼の深度推定と画像補完であるインペインティングを用いている。


2. 新規性

image.png
各生成画像のコンテンツをシームレスなテクスチャ入りの3Dメッシュに合成する際に、適切なカメラ視点の選択を行うことで自然な見かけを実現した。


3. 実現方法

image.png
各カメラポーズに対して、インペインティングを用いて生成された画像のRGBとDepthの両方を補完する。Depth AlighnmentとMesh Filteringを行って次のメッシュをパッチ単位で取得し、生成済みのシーンと合成していく。これを繰り返すことで、任意視点からの見かけに対してシームレスにテクスチャが連続した3Dメッシュが構築できる。


4. 結果

image.png
image.png
テキストプロンプトから、部屋の詳細な家具やテクスチャ情報まで反映させて3次元シーンを構築できるようになった。


Paper URL: https://openaccess.thecvf.com/content/ICCV2023/html/Hollein_Text2Room_Extracting_Textured_3D_Meshes_from_2D_Text-to-Image_Models_ICCV_2023_paper.html

last updates: Nov 24 2023

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0