PR|本記事にはプロモーションを含みます
キャラLoRAを作ったのに、思ったように再現できないことがあります。
顔が安定しない。
服だけ固定される。
背景や小物まで出てくる。
角度を変えると別人っぽくなる。
こうした失敗は、画像枚数や学習設定だけが原因とは限りません。
学習前のデータセット設計で「何を固定して、何を変えてよい要素として残すか」が整理できていないことが原因になることがあります。
この記事では、キャラLoRA用のデータセットを作るときに見るべきポイントを整理します。
LoRAデータセットは「固定する要素」と「変えてよい要素」で考える
LoRAデータセットは、ただ学習画像を集めたフォルダではありません。
AIに「この特徴を覚えてほしい」と伝えるための材料です。
人間はイラストを見て、キャラ本体、服、背景、小物を自然に分けて見ます。
しかし、AIは画像内の要素を最初から都合よく分離してくれるわけではありません。
キャラLoRAを作るなら、まず画像内の要素を次の3つに分けて考えると整理しやすくなります。
固定する要素
キャラLoRAで毎回残したい特徴です。
・髪型
・髪色
・目の形
・目の色
・顔立ち
・体型
・固有アクセサリー
・キャラ固有のパーツ
ここが画像ごとにズレると、AIは「どれがそのキャラらしさなのか」をつかみにくくなります。
たとえば、ある画像では丸い目、別の画像ではつり目。
ある画像ではショートヘア、別の画像ではボブ寄り。
このようなズレが多いと、顔や雰囲気が安定しにくくなります。
変えてよい要素
生成時に自由度として残したい部分です。
・表情
・ポーズ
・背景
・構図
・光源
・衣装
これらをすべて固定すると、生成時に服を変えにくい、背景が毎回似る、ポーズの自由度が落ちるといった問題が出やすくなります。
キャラLoRAでは、キャラ本人を固定しながら、表情や構図には幅を持たせることが重要です。
入れない方がよい画像
学習対象をぼやけさせやすい画像です。
・顔が小さい
・顔が手や髪で隠れている
・複数人が写っている
・背景が強すぎる
・小物が多すぎる
・画風が明らかに違う
・文字や透かしが入っている
・同じ構図ばかり
見た目がきれいな画像でも、学習には向かないことがあります。
LoRAデータセットでは、完成絵としての派手さより、AIが学習対象を読み取りやすいかを優先します。
整理すると、次のようになります。
| 画像内の要素 | 扱い方 | 理由 |
|---|---|---|
| 髪型・髪色 | 固定する | キャラ識別に直結する |
| 目・顔立ち | 固定する | 顔の再現性に影響する |
| 表情 | 変えてよい | 固定しすぎると使いにくい |
| 服装 | 目的次第 | キャラLoRAか衣装LoRAかで変わる |
| 背景 | 弱める・変える | 背景固定を避ける |
| 小物 | 固有パーツだけ残す | 一時的な小物はノイズになりやすい |
| 画風 | ある程度揃える | キャラ学習と画風学習が混ざるのを防ぐ |
キャラLoRAが崩れる原因を出力結果から見る
LoRAデータセットの問題は、生成結果に出ます。
ここでは、よくある崩れ方から、データセット側で見直すべき点を整理します。
顔が安定しない
正面では似ているのに、斜め向きや横顔で別人になる。
笑顔では似ているのに、真顔や困り顔で印象が変わる。
このときは、顔の核になる情報がデータセット内で揃っているかを見ます。
確認したいのは、次のような要素です。
・目の形
・前髪
・輪郭
・顔の幼さ、大人っぽさ
・髪のボリューム
・横顔や斜め顔で残る特徴
正面アップだけを集めると、正面の顔は覚えやすくなります。
ただし、角度が変わったときの見え方を学びにくくなります。
キャラLoRAでは、正面、斜め、横顔寄り、上半身などを混ぜ、角度が変わっても同じキャラに見える画像を選ぶことが重要です。
服だけ固定される
顔は似ているのに、毎回同じ服が出ることがあります。
原因は、データセット内でキャラと服装が常にセットになっていることです。
すべての画像で同じ制服を着ていると、AIはその制服もキャラの特徴として扱いやすくなります。
ここでは、目的を分ける必要があります。
・キャラそのものを作りたいのか
・特定の衣装を作りたいのか
・キャラと衣装をセットで固定したいのか
キャラLoRAとして使いたいなら、服装にはある程度の幅を持たせた方が扱いやすくなります。
特定の衣装を再現したいなら、それは衣装LoRAに近い考え方です。むしろやるべきです。
同じ画像でも、目的が変われば良いデータセットにも悪いデータセットにもなります。
背景や小物まで出る
毎回同じ教室が出る。
同じぬいぐるみが横に出る。
特定の椅子、机、窓まで再現される。
これは、背景や小物が画像内で強く繰り返されているサインです。
ヘアピンやイヤーカフのように、キャラ固有の特徴として残したい小物なら問題ありません。
一方で、たまたま持っている小物や、その場限りの背景まで毎回入っていると、生成時にも一緒に出やすくなります。
背景や小物は、「キャラを説明する要素」なのか、「たまたま写っている要素」なのかを分けて考えます。
画風が混ざる
キャラは同じはずなのに、絵柄が安定しないこともあります。
ある画像は厚塗り。
別の画像は線が細い。
別の画像は彩度が高い。
さらに別の画像は淡い塗り。
この状態でキャラLoRAを作ると、AIはキャラの特徴と画風の違いを同時に学ぼうとします。
結果として、顔も画風も中途半端になることがあります。
キャラLoRAでは、画風のブレをある程度抑えた方が学習対象を絞りやすくなります。
反対に、画風LoRAを作るなら、キャラではなく線、塗り、色、陰影、質感の共通点を揃える方が自然です。
公式ガイドの推奨枚数は「目安」として使う
LoRAデータセット学習には、ある程度の画像枚数の目安があります。
PixAI公式ブログの「LoRA 学習完全ガイド」では、LoRAの種類ごとに推奨枚数が紹介されています。
| LoRAの種類 | 画像枚数の目安 |
|---|---|
| キャラLoRA | 15〜30枚 |
| 画風LoRA | 20〜40枚 |
| ポーズLoRA | 10〜20枚 |
| 衣装LoRA | 15〜25枚 |
ただし、これは「この枚数を入れれば成功する」という意味ではありません。
枚数は参考です。
たとえば、キャラLoRAで15〜30枚を用意しても、全画像が同じ服、同じ背景、同じ正面顔なら、生成結果は偏りやすくなります。
逆に、枚数が多くても、顔が小さい画像、複数人が写った画像、画風が大きく違う画像を混ぜると、学習対象が曖昧になります。
大切なのは、画像ごとの役割を分けることです。
キャラLoRA用データセットの組み方
キャラLoRAを作るなら、まず固定要素を書き出します。
例として、次のようなメモを作ります。
・ミント色のショートヘア
・琥珀色の目
・星形ヘアピン
・小柄な体型
・明るい表情が似合う
このメモが、画像を選ぶときの基準になります。
次に、15〜30枚の中で画像の役割を分けます。
20枚前後で組むなら、たとえば次のように構成します※一例。
| 役割 | 枚数目安 | 目的 |
|---|---|---|
| 正面顔 | 3 | 顔の基準を作る |
| 斜め顔 | 3 | 角度差でも特徴を残す |
| 横顔寄り | 2 | 輪郭と髪型を補う |
| 上半身 | 3 | 顔と体型のバランスを見る |
| 全身 | 2 | シルエットを確認する |
| 表情違い | 3 | 表情の幅を持たせる |
| ポーズ違い | 2 | 構図固定を避ける |
| 背景違い | 2 | 背景固定を避ける |
この配分は固定ルールではありません。
顔が崩れるなら顔寄りの画像を増やす。
全身で別人になるなら上半身や全身を増やす。
服が固定されるなら衣装差分を入れる。
生成結果を見ながら、足りない情報を補っていきます。
同時に、入れない画像も決めておきます。
・顔が小さい画像
・複数人が写っている画像
・背景が強い画像
・小物が多い画像
・画風が違いすぎる画像
・文字や透かしがある画像
・同じ構図ばかりの画像
データセット作りでは、画像を増やすことより、不要な情報を減らすことが重要です。
トリガーワードは「固定したい特徴」をまとめる
LoRA学習では、トリガーワードを設定します。
ただし、トリガーワードを1つ入れれば、キャラが自動で安定するわけではありません。
特にDiT.2系の生成モデル、たとえばTsubaki.2のようなモデルで使うことを考えるなら、単語を1つ置くだけではなく、固定したい特徴を短くまとめたトリガーフレーズとして設定すると扱いやすくなります。
例:
mira_character, mint short hair, amber eyes, star hairpin, small body
ここに入れるのは、常に残したい特徴です。
・キャラ識別子
・髪型
・髪色
・目の特徴
・固有アクセサリー
・体型などの固定要素
反対に、毎回変えたい要素は入れすぎない方がよいです。
・背景
・ポーズ
・毎回変えたい衣装
・一時的な小物
・表情
トリガーフレーズは、キャラの説明文ではありません。
生成時に固定したい特徴を呼び出すための短い設計メモです。
学習時のモデルタイプと生成時のモデルを合わせる
LoRAは、学習して終わりではありません。
生成時にどのモデルで使うかまで考える必要があります。
PixAIなどでLoRA学習を行うときは、DiT.2、DiT.1、SDXL、SD 1.5などのモデルタイプが使えます。
生成時にLoRAを使うときは、そのLoRAがどのモデルタイプを前提に学習されたかを見ることが重要です。
例としては、次のように考えます。
・DiT.2で学習したLoRA → まずDiT.2系生成モデルで確認
・DiT.1で学習したLoRA → まずDiT.1系生成モデルで確認
・SDXLで学習したLoRA → まずSDXL系生成モデルで確認
・SD 1.5で学習したLoRA → まずSD 1.5系生成モデルで確認
Tsubaki.2は、ここではDiT.2系の生成モデルとして相性を見る対象になります。
学習時のモデルタイプと生成時のモデルが大きくズレると、顔、線、塗り、手、服の細部、装飾にイレギュラーな崩れが出ることがあります。
作品として使うなら、まずは学習時のモデルタイプに近い生成モデルで確認するのが安全です。
その後で、別モデルに載せたときの変化を見る方が、崩れの原因を切り分けやすくなります。
確認フロー
最後に、キャラLoRA用データセットを作るときのフローを整理します。
- 作りたいLoRAの種類を決める
- 公式ガイドの推奨枚数を目安として確認する
- 固定する要素を書き出す
- 変えてよい要素を決める
- 入れない画像を決める
- 15〜30枚を目安に役割分担して集める
- トリガーフレーズを決める
- 学習時のモデルタイプを確認する
- 生成時は同系統モデルから試す
- 崩れた要素に合わせて画像を足す・抜く
PixAIでは、アニメAI生成やLoRA学習をブラウザ上で扱えるため、データセット作成から生成結果の確認まで同じ流れで進めることができます。
初めてPixAIを使う場合は、紹介コードCH2ZYWVHを利用して登録すると、画像生成に使えるクレジットを20,000ポイント受け取れます。ぜひご利用ください。
まとめ
キャラLoRAが崩れる原因は、サンプリングの画像不足だけではありません。
重要なのは、学習前に次の点を整理することです。
・固定する要素を決める
・変えてよい要素を残す
・入れない画像を決める
・公式ガイドの推奨枚数を目安として使う
・画像ごとの役割を分ける
・トリガーフレーズは固定したい特徴に絞る
・学習時のモデルタイプと生成時モデルの相性を見る
顔が似ない、服が固定される、背景まで出てくる。
そうした結果が出たときは、設定だけでなく、データセットの中身を見直すと原因が見えやすくなります。
画像を足す。
不要な画像を抜く。
役割が偏っている部分を補う。
この調整まで含めて、LoRAデータセット設計です。





