[Pony] Yuuki Sakuna (結城さくな)

詳細

ファイルをダウンロード

モデル説明

結城さくな (Yuuki Sakuna) - ポニーロラ

免責事項

  • 私のLoRAを使ってAI画像を生成し、Twitter/Xでファンアートに彼女のハッシュタグを付けることはしないでください。ただし、その画像に十分な貢献をしている場合を除きます。

バージョン3の説明

  • dim/alphaを16/12に減らす

  • スケール重み正規化を1.5に設定(過学習を防止)

  • スケジューラを変更

  • 新しいデータセット+キャプションを追加

  • 彼女の笑顔は:3ではなく:)になりにくくなった

トリガーワード(バージョン3専用)

  • デフォルトの衣装
yuuki sakuna, long hair, blush, animal ears, pink hair, medium breasts, hair ornament, maid headdress, bow, maid, animal ear fluff, puffy sleeves, apron, white dress, bowtie, collarbone, hairclip, hair bow, detached collar, black footwear, shoes, black choker, white thighhighs
  • どの衣装でも
yuuki sakuna, long hair, blush, cat ears, pink hair, medium breasts, hair ornament, bowtie, hairclip, hair bow

制限事項

  • 一部の衣装が正しく変更できない(データセットが不足しているため)

  • 全身描写はまだ不正確(しかし大幅に改善)

バージョン2の説明

  • 実験的オプティマイザを使用(全身に若干の改善が見られるが、カメラ角度はプロンプトで指定しないと変化しない)

  • 衣装を変えてもリボンが残る

バージョン1の説明

  • 猫耳の女の子が好きなので、LoRAとして学習させました(彼女の過去については一切知りません :<)

トリガーワード

  • トリガーワード
yuuki sakuna
  • どの衣装でも(まだ十分に柔軟ではない)
yuuki sakuna, long hair, animal ears, pink hair, blush, cat ears, pink eyes, two side up, ahoge, colored inner hair, two-tone hair
  • デビュー衣装(良いが、一部の要素が不足している)
yuuki sakuna, long hair, hair ornament, bow, animal ears, pink hair, blush, cat ears, maid headdress, hair bow, frills, hairclip, pink eyes, pink bow, blue bow, maid, puffy sleeves, two side up, cat hair ornament, ahoge, heart hair ornament, puffy short sleeves, clothing cutout, pink dress, blue bow, colored inner hair, two-tone hair, cleavage, breasts
  • 全身を描くには以下のテキストを追加すると良い(靴はまだ正しくない)
shoes, black footwear, white thighhighs

制限事項

  • 衣装を正しく変更できない(デビュー衣装の一部の要素が残っている)

  • 全身描写は効果的でない可能性がある

  • LoRAはまだわずかにアンダーフィッティング(ミディアムレアのポークのように)(バージョン1)

  • バージョン2 は些細な詳細が改善されたが、データセットの多様性がまだ不十分(画像のバランスが悪いため)

学習詳細(バージョン3)

LoRAサイズ

  • 次元数を8に減らし、sv_fro=0.95を適用

データセット

  • 42枚の画像

パラメータ

  • 解像度 = 1024

  • バッチサイズ = 2

  • dim,alpha = 16,12(学習用)

  • 混合/保存精度 = bf16/bf16

  • オプティマイザ = AdEMAMix + weight_decay=0.025 betas=0.9,0.999,0.9999

  • UNet学習率 = 2e-4

  • TE学習率 = 1e-4

  • スケジューラ = cosine_with_min_lr(min_lr_ratio 0.67)

  • huber snr = 0.85

ステップ数

  • エポック = 5

  • 合計ステップ数 = 1575

  • 繰り返し回数 = 15(1つのコンセプトのみ)

ツール

  • kohya-ss GUI v24.3.0(私がフォーク)

  • torch 2.5.0 cu124

  • RTX 3060 12 GB + xformers + gradient_checkpointing

重み

  • UNet平均重み:0.0149531283161857

  • TE1平均重み:0.011002991641968642

  • TE2平均重み:0.009832777519477531

学習詳細(バージョン2)

LoRAサイズ

  • 次元数を8に減らし、ダイナミックalphaを使用

データセット

  • 38枚の画像(大部分は半身)

パラメータ

  • 解像度 = 1024

  • バッチサイズ = 2

  • dim,alpha = 16,16(学習用)

  • 混合/保存精度 = bf16/bf16

  • オプティマイザ = AdEMAMix(32bitでVRAM消費)

  • UNet学習率 = 2e-4

  • TE学習率 = 1e-4

  • スケジューラ = inverse_sqrt(ウォームアップ100ステップ)

  • L2損失のみ使用

ステップ数

  • エポック = 10

  • 合計ステップ数 = 2850

  • 繰り返し回数 = 15(1つのコンセプトのみ)

ツール

  • kohya-ss GUI v24.2.0

  • torch 2.5.0 cu124

  • RTX 3060 12 GB + xformers + gradient_checkpointing

重み

  • UNet平均重み強度:0.015634962041489377

  • Text Encoder (1) 平均重み強度 Clip_L:0.011193290141749815

  • Text Encoder (2) 平均重み強度 Clip_G:0.010691167576002698

学習詳細(バージョン1)

データセット

  • 38枚の画像(大部分は半身)

パラメータ

  • 解像度 = 1024

  • バッチサイズ = 2

  • dim,alpha = 16,16(LoRAが十分に良ければ品質を維持するためにリサイズしない :P)

  • 混合/保存精度 = bf16/fp16(誤って変更)

  • オプティマイザ = AdEMAMix8bit

  • UNet学習率 = 1e-4

  • TE学習率 = 5e-05

  • スケジューラ = inverse_sqrt(ウォームアップ100ステップ)

  • huber snr(c = 0.85)

ステップ数

  • エポック = 10

  • 合計ステップ数 = 2850

  • 繰り返し回数 = 15(1つのコンセプトのみ)

  • full_bf16学習

ツール

  • kohya-ss GUI v24.2.0

  • torch 2.5.0 cu124

  • RTX 3060 12 GB + xformers + gradient_checkpointing

重み

  • UNet平均重み強度:0.008335085569112463

  • Text Encoder (1) 平均重み強度 Clip_L:0.0073367764333498705

  • Text Encoder (2) 平均重み強度 Clip_G:0.005826970830639767

説明元:Gtonero

*このLoRAは新しい技術でLoRA学習を研究するためのものです。VTuberを損なう目的で使用しないでください(彼女のサポートもお願いします)。

このモデルで生成された画像

画像が見つかりません。