1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

3D Gaussian Splattingの最新動向:衛星画像から歩ける3D都市を生成するSkyfall-GS

Posted at

はじめに

2024年から2025年にかけて、3D再構築技術の分野で3D Gaussian Splatting(3DGS)が急速に注目を集めています。特に最近発表されたSkyfall-GSは、衛星画像のみから歩行可能な3D都市モデルを生成できる画期的な技術として話題になっています。

以下の動画で、Skyfall-GSが生成した3D都市モデルの実際の動作を確認できます:

本記事では、Gaussian Splattingがなぜ今流行しているのか、その技術的背景と最新の応用事例について解説します。

想定読者: コンピュータビジョンやAI技術に興味のあるエンジニア、3Dモデリング技術の動向を知りたい方

記事を読むと得られること:

  • 3D Gaussian Splattingの基本概念と特徴
  • 従来手法と比較した優位性
  • 最新の応用事例(Skyfall-GS)の詳細
  • この技術が注目される理由

3D Gaussian Splattingとは

基本概念

3D Gaussian Splatting(3DGS)は、3Dシーンを光の点の雲(Gaussian)の集合として表現する3D再構築技術です1。従来のNeRF(Neural Radiance Fields)と比較して、高速なレンダリングと高品質な3D再構築を両立できる点が特徴です。

上記の図は、3D Gaussian Splattingの基本的な処理フローを示しています。複数の入力画像から3DGSによってGaussianの点群を生成し、それを高速レンダリングすることでリアルタイムに3D表示を実現します。

技術的特徴

3D Gaussian Splattingの主な特徴は以下の通りです:

  • 高速レンダリング: 従来のNeRFと比較して数十倍から数百倍高速
  • 高品質な再構築: シャープなエッジとディテールの保持
  • メモリ効率: 効率的なデータ構造による省メモリ性
  • リアルタイム性: 標準的なGPUでリアルタイムレンダリングが可能

従来手法との比較

上記の図は、3D再構築技術の分類と各手法の特徴を示しています。3D Gaussian Splattingは、NeRF系の高品質とPoint Cloudの高速性を両立した技術として位置づけられます。

手法 レンダリング速度 品質 メモリ使用量
NeRF 遅い (0.1-1 FPS)
Point Cloud 速い (30+ FPS)
3D Gaussian Splatting 非常に速い (40+ FPS)

なぜ今流行しているのか

1. パフォーマンスの劇的な向上

3D Gaussian Splattingは、NeRFの品質を維持しながら、レンダリング速度を大幅に改善しました。これにより、リアルタイムアプリケーションでの利用が現実的になりました。

2. 実用的なアプリケーションの登場

ゲーム開発、映画制作、ロボティクス、デジタルツイン構築など、実用的な応用先が明確になったことで、研究開発が加速しています。

3. オープンソース化の進展

多くの実装がGitHubで公開され、研究者やエンジニアが容易にアクセスできるようになったことも、普及を後押ししています。

4. ハードウェアの進化

GPUの性能向上により、一般的なPCやMacBook Airでも十分なパフォーマンスが得られるようになりました。

Skyfall-GS: 衛星画像から3D都市を生成

概要

Skyfall-GSは、 通常の衛星画像のみ から歩行可能な3D都市モデルを生成できる最新技術です2。高価な3Dスキャナーや専用の撮影車両を必要とせず、既存の衛星画像データから都市全体の3Dモデルを構築できます。

デモ: https://skyfall-gs.jayinnn.dev/
ソースコード: https://github.com/jayin92/skyfall-gs

技術的アプローチ

Skyfall-GSは2つのAI技術を組み合わせています:

  1. 3D Gaussian Splatting: 基本的な3D構造の構築
  2. Diffusion Models: 不足しているディテールの補完

上記の図は、Skyfall-GSの処理フローを示しています。衛星画像から始まり、3D Gaussian Splattingで粗い3D構造を作成した後、5段階のプロセスでカメラ角度を徐々に下げながら、Diffusion Modelでディテールを補完していく流れを表現しています。

学習プロセス

Skyfall-GSの名前は、学習戦略に由来しています。システムは高高度の視点から始めて、段階的に地上レベルまで降下していきます:

  1. 第1段階(85度): 衛星画像から粗い3D構造を構築
  2. 第2段階(70度): 建物の上部ディテールを改善
  3. 第3段階(55度): ファサード(建物の正面)の追加
  4. 第4段階(45度): 地上レベルの詳細化
  5. 第5段階: 最終的な品質向上

各段階で54枚の異なる視点からの画像を生成し、AIがテキストプロンプトに基づいて改善を行います。

パフォーマンス

Skyfall-GSは従来手法を大きく上回るパフォーマンスを実現しています:

  • 標準GPU: 11 FPS
  • MacBook Air: 最大40 FPS
  • 従来手法(CityDreamer): 0.18 FPS(高価なハードウェアでも)

ユーザースタディ(89名参加)では、Skyfall-GSが97%の比較でジオメトリと全体品質の両方において最高評価を獲得しました2

実用化の可能性

WorldView-3衛星は1日あたり約68万平方キロメートルを最大31センチメートル/ピクセルの解像度で撮影しています3。この膨大な衛星データを活用することで、大規模な自動3Dモデリングが可能になります。

潜在的な応用分野:

  • ゲーム開発: 都市環境の効率的な生成
  • 映画制作: デジタル背景の作成
  • ロボティクス: 実世界空間のシミュレーション
  • 都市計画: デジタルツインの構築
  • 災害対策: 被災地域の3Dモデル化

技術的課題

Skyfall-GSの研究者は、以下の課題を認識しています:

  • 計算リソース: 依然として大量の計算能力が必要
  • 詳細な街路シーン: 非常に詳細な地上レベルの表現にはまだ改善の余地がある
  • スケーラビリティ: 将来のバージョンでの改善を目指している

オープンソース化

Skyfall-GSのコードはGitHubで公開されており4、プロジェクトウェブサイト5ではデモも閲覧できます。論文もarXivで公開されています6

他の注目すべき応用事例

Tencent Voyager

Tencentが開発したVoyagerは、従来のモデリングパイプラインを使わずに3Dシーン内でカメラモーションをシミュレートできる技術です(2025年9月発表)7

Hunyuan World Model 1.0-Lite

同じくTencentが開発した軽量版の3Dシーン生成モデルで、より高速でリソース効率の良い3D生成を実現しています(2025年8月発表)8

まとめ

3D Gaussian Splattingは、3D再構築技術の新しいスタンダードになりつつあります。その理由は以下の通りです:

技術的優位性:

  • NeRFの品質を維持しながら、レンダリング速度を大幅に改善
  • 標準的なハードウェアでリアルタイム動作が可能
  • メモリ効率が良く、実用的なアプリケーションに適している

実用化の進展:

  • Skyfall-GSのような革新的な応用例の登場
  • ゲーム、映画、ロボティクス、都市計画など幅広い分野での活用
  • オープンソース化により、誰でも技術にアクセス可能

今後の展開:

  • より詳細なシーン再構築への改善
  • 計算効率のさらなる向上
  • 新たな応用分野の開拓(VR/AR、メタバースなど)

3D Gaussian Splattingは、単なる研究トピックから実用的な3D技術へと進化しつつあります。特に、既存の衛星データを活用できるSkyfall-GSのようなアプローチは、今後のデジタルツイン構築やスマートシティ開発において重要な役割を果たすでしょう。

参考文献

  1. Researchers advance generative AI for 3D modeling with 3D Gaussian splatting - THE DECODER

  2. Skyfall-GS turns satellite images into walkable 3D cities - THE DECODER 2

  3. WorldView-3 - ESA Earth Observation Portal

  4. GitHub - jayin92/skyfall-gs

  5. Skyfall-GS Project Website

  6. arXiv:2510.15869 - Skyfall-GS

  7. Tencent's Voyager can simulate camera motion in 3D scenes - THE DECODER

  8. Tencent releases Hunyuan World Model 1.0-Lite - THE DECODER

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?