More than 1 year has passed since last update.

LoRAによるめるアイコン生成

Posted at 2023-04-22

めるアイコンとは

左下から顔を出してるデザインの、私が描いているデフォルメイラストアイコンです。

最近は仕事が忙しくてなかなか描けていませんが、たまに依頼募集してます。

先行研究

めるアイコンのAI生成はすでに先行研究がいくつかあります。

UGATITによる手法（@zassou65535さん）

Progressive GANによる手法（同じく、@zassou65535さん）

StyleGAN2による手法（@kunseicunseiさん）

私は@zassou65535さんや@kunseicunseiさんと違って機械学習はド素人なのですが、LoRAを使えばそんな私でもお手軽にAI生成ができるぞってことで、やってみました。

この記事では技術に関する詳細な説明は行いません。

結果

適当に背景色を指定しながら16枚ずつ出力しました。

私としては、これはなかなか良さそうだぞ、と思いました。

深掘り

学習データ

過去に書いた700枚以上あるアイコンから、特に可愛くかけたぞって自信があるやつを349枚選びました。

使用したもの

基礎技術はStableDiffusionです。
ベースとなるモデルはanything-v4.5-prunedです。
キャプションの生成はwd14-taggerを利用しました。
LoRA学習はsd-scriptsを利用しました。
最終的な生成にはStable Diffusion web UIを用いました。

キャプション

キャプションはwd14-taggerによる自動生成ですが、以下をExclude tagsに設定しています。
solo, 1girl, simple background, looking at viewer, dutch angle, outline

学習

train_batch_size = 3 (4以上だとメモリ的に無理でした。)
max_train_epoch = 15 (だいたい10～15あたりで頭打ちになるように思われます。)
num_repeats = 1

これで計1755ステップ、25分12秒で学習は終了しました。

環境

CPU : AMD Ryzen 7 7700X 8-Core Processer
GPU : NVIDIA GeForce RTX 3070 Ti
RAM : 32GB(16GBx2) 4800 MHz

プロンプト

青背景 : (best quality, masterpiece:1.2), (melicon:1.3), blue background, smile, <lora:melicon-anything4.5-15epoch:1>

緑背景 : (best quality, masterpiece:1.2), (melicon:1.3), green background, smile, <lora:melicon-anything4.5-15epoch:1>

ピンク背景 : (best quality, masterpiece:1.2), (melicon:1.3), pink background, smile, <lora:melicon-anything4.5-15epoch:1>

黄背景 : (best quality, masterpiece:1.2), (melicon:1.3), yellow background, smile, <lora:melicon-anything4.5-15epoch:1>

ネガティブプロンプト

(worst quality, low quality:1.2), bad anatomy, bad hands, missing arms, text error, missing fingers, jpeg artifacts, long neck, signature, watermark, blurry, fisheye lens, animal, deformed mutated disfigured, mutated hands, missing hands, extra hands, liquid hands, poorly drawn hands, mutated fingers, bad fingers, extra fingers, liquid fingers, poorly drawn fingers, bad legs, missing legs, extra legs, bad arms, extra arms, long torso, thick thighs, partial head, bad face, partial face, bad eyebrows,

（テルルとロビンチャンネルの動画を参考にしました。）

参考にしたもの

LoRA学習は以下の動画を参考にしました。非常にわかりやすかったです。

Stable Diffusion web UIの使い方は以下の動画を参考にしました。こちらも非常にわかりやすかったです。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

LoRAによる めるアイコン生成