UltimatePinkPig Realistic

詳細

ファイルをダウンロード

モデル説明

このLoRAはリアルなピンク色のブタ用です。

ミニサイズが普通、ピンク色がほとんど、でもブタはいつも。

多くの人が「どうやって学習させたんですか?」と聞いてくるので、設定を紹介します:

更新:2023年5月15日 — エポックを50に変更し、ファイル名(繰り返し)を2_XXXに変更。

1: Koyah_SS GUI

私は Koyha_SS GUI を使ってLoRAを学習しています。

重要な設定:

"max_resolution": "768,768"

(GPUが非常に強力な場合、1024,1024を使用するとさらに良い结果になります)

"learning_rate": "3e-6",

"lr_scheduler": "cosine_with_restarts",

"lr_warmup": "5",

"train_batch_size": 4,

"epoch": "5",

  • (2023年5月15日:エポックを"50"に、ファイル名を2_XXXに変更)

"save_every_n_epochs": "40",

"mixed_precision": "bf16",

"save_precision": "bf16",

"enable_bucket": true,

"use_8bit_adam": false,

"text_encoder_lr": "1e-5",

"unet_lr": "5e-5",

"network_dim": 128,

"clip_skip": 2,

"network_alpha": 64,

"persistent_data_loader_workers": true,

"optimizer": "Lion"

ハードウェアが私の設定に対応しない場合、バッチサイズを2または1に減らしてみてください。これにより学習時間は大きく増加します。学習時間を短くしたい場合は、エポックを2に設定すると解決できます。

個人的には、私のハードウェアが対応しているためエポック5を使用しています。より高いエポック値は元画像からより多くの細部を捉える可能性があると考えますが、必須ではありません。

2. 学習用画像セット:

画像選定:

50枚の高解像度(クロップ前のサイズは少なくとも1024×1024)の画像。うち約25枚をクローズアップ、20枚を上半身ショット、5枚を全身ショットとして選定。画像の角度が多ければ多いほど良いです。

前処理:

WebUIの自動焦点クロップ機能を使用し、クロッピングのサイズを少なくとも768×768以上、最大1536×1536に設定します。

BLIPとDeepdanbooruを統合してキャプションをつけ、さらに stable-diffusion-webui-wd14-tagger 拡張機能を使って追加キャプションを生成します。既存のキャプションに追加するように選択し、「重複タグを削除」も選択してください。

その後、BooruDatasetTagManager を使って手動でキャプションを希望する内容に修正します。

画像ファイル名:

50_XXX

(これは、画像ファイル内の各画像が50回繰り返されることを意味します)

  • 2023年5月15日:2_XXXに変更。ただしエポックを50へ増加

これで準備が整います!

ただし、元画像の選定の影響により、出来上がったLoRAを試してみて、満足いくLoRAが得られるまで複数回元画像を調整する必要があるかもしれません。また、各人のハードウェア環境が異なるため、768×768の解像度でバッチサイズ4が使用できない場合は、2や1に下げて試してみてください。

私はLoRAの結果が元画像に非常に敏感であると考えており、画像の選定とタグ付けが実際に最も重要です。LoRAを試してみて、「悪い」元画像がどのようなものか判断できます。改善のためには、その「悪い」画像を元画像から削除するだけでOKです。また、LoRAに問題が発生した場合、タグの修正が求められることがあります。例えば、「湿った」効果が常に生成される場合、関連する元画像に「wet(湿った)」「rain(雨)」「pool(プール)」のタグが付いていない可能性があります。

3. 学習:

普段使用しているチェックポイントを確認し、それが何に基づいているかを把握してから、それに基づいたベースモデルを選択してください。学習頑張ってください。

このモデルで生成された画像

画像が見つかりません。