2
0

リアルタイムLCMでバ美肉しよう。

Last updated at Posted at 2024-03-09

2023/11頃に遊んだネタ供養

構成

LCMトハ

StableDiffusionで画像を生成するのに32ステップくらいで1分とかかかるのが普通のところ、1~4ステップで、しかも爆速で生成しちゃうよ!という素敵技術

RealTime LCMトハ

そんな爆速で生成できるなら、カメラキャプチャからリアルタイムでレンダリングできるくね??という発想に基づいた素敵技術

とりあえずRealTime LCMのデフォモデル

めっちゃ自然に追従する。
バックエンドはawsのGPU積んでるEC2とか使ってた気がする。(既に忘れた)

モデル差し替え、年齢性別変更

ControlNetで人外になろうぜ!

CrucibleAI/ControlNetMediaPipeFace · Hugging Face

要改善ポイント

顔(キャラ)のブレが大きい→ControlNetで一枚絵を渡せば安定すると思う。
アニメ系の顔になりきれない(バランスが合わない)→モデル選択+ControlNetでどうにかなるとおもう

とか言ってたら、翌週にこんなのが出たので、まぁ、どうでもいいですね。

Microsoft、テキストの内容を実写アバターに話させるツールを発表。リアルタイムに対話できるボットアバターも可能
zhoudaquan/ChatAnything: Official Repo for the Paper: CHATANYTHING: FACETIME CHAT WITH LLM-ENHANCED PERSONAS

関連技術

Animate Anyone

一枚絵+モーション検出でぬるぬる動かすやつ

SD-turboで毎秒100枚以上の画像を生成できるシステム「StreamDiffusion」

ConsiStory

LoRAとかなしで一貫性のあるキャラクターとかを生成するよ、というやつ

InstantID/InstantID: InstantID : Zero-shot Identity-Preserving Generation in Seconds 🔥

参照画像1枚で、一貫性のある画像を生成するよーってやつ

結論

なりたい姿になれる!のコストがめっちゃ下がるの嬉しい。

2
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0