[Pony] Yuuki Sakuna (結城さくな)
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
結城さくな (Yuuki Sakuna) - ポニーロラ
免責事項
- 私のLoRAを使ってAI画像を生成し、Twitter/Xでファンアートに彼女のハッシュタグを付けることはしないでください。ただし、その画像に十分な貢献をしている場合を除きます。
バージョン3の説明
dim/alphaを16/12に減らす
スケール重み正規化を1.5に設定(過学習を防止)
スケジューラを変更
新しいデータセット+キャプションを追加
彼女の笑顔は:3ではなく:)になりにくくなった
トリガーワード(バージョン3専用)
- デフォルトの衣装
yuuki sakuna, long hair, blush, animal ears, pink hair, medium breasts, hair ornament, maid headdress, bow, maid, animal ear fluff, puffy sleeves, apron, white dress, bowtie, collarbone, hairclip, hair bow, detached collar, black footwear, shoes, black choker, white thighhighs
- どの衣装でも
yuuki sakuna, long hair, blush, cat ears, pink hair, medium breasts, hair ornament, bowtie, hairclip, hair bow
制限事項
一部の衣装が正しく変更できない(データセットが不足しているため)
全身描写はまだ不正確(しかし大幅に改善)
バージョン2の説明
実験的オプティマイザを使用(全身に若干の改善が見られるが、カメラ角度はプロンプトで指定しないと変化しない)
衣装を変えてもリボンが残る
バージョン1の説明
- 猫耳の女の子が好きなので、LoRAとして学習させました(彼女の過去については一切知りません :<)
トリガーワード
- トリガーワード
yuuki sakuna
- どの衣装でも(まだ十分に柔軟ではない)
yuuki sakuna, long hair, animal ears, pink hair, blush, cat ears, pink eyes, two side up, ahoge, colored inner hair, two-tone hair
- デビュー衣装(良いが、一部の要素が不足している)
yuuki sakuna, long hair, hair ornament, bow, animal ears, pink hair, blush, cat ears, maid headdress, hair bow, frills, hairclip, pink eyes, pink bow, blue bow, maid, puffy sleeves, two side up, cat hair ornament, ahoge, heart hair ornament, puffy short sleeves, clothing cutout, pink dress, blue bow, colored inner hair, two-tone hair, cleavage, breasts
- 全身を描くには以下のテキストを追加すると良い(靴はまだ正しくない)
shoes, black footwear, white thighhighs
制限事項
衣装を正しく変更できない(デビュー衣装の一部の要素が残っている)
全身描写は効果的でない可能性がある
LoRAはまだわずかにアンダーフィッティング(ミディアムレアのポークのように)(バージョン1)
バージョン2 は些細な詳細が改善されたが、データセットの多様性がまだ不十分(画像のバランスが悪いため)
学習詳細(バージョン3)
LoRAサイズ
- 次元数を8に減らし、sv_fro=0.95を適用
データセット
- 42枚の画像
パラメータ
解像度 = 1024
バッチサイズ = 2
dim,alpha = 16,12(学習用)
混合/保存精度 = bf16/bf16
オプティマイザ = AdEMAMix + weight_decay=0.025 betas=0.9,0.999,0.9999
UNet学習率 = 2e-4
TE学習率 = 1e-4
スケジューラ = cosine_with_min_lr(min_lr_ratio 0.67)
huber snr = 0.85
ステップ数
エポック = 5
合計ステップ数 = 1575
繰り返し回数 = 15(1つのコンセプトのみ)
ツール
kohya-ss GUI v24.3.0(私がフォーク)
torch 2.5.0 cu124
RTX 3060 12 GB + xformers + gradient_checkpointing
重み
UNet平均重み:0.0149531283161857
TE1平均重み:0.011002991641968642
TE2平均重み:0.009832777519477531
学習詳細(バージョン2)
LoRAサイズ
- 次元数を8に減らし、ダイナミックalphaを使用
データセット
- 38枚の画像(大部分は半身)
パラメータ
解像度 = 1024
バッチサイズ = 2
dim,alpha = 16,16(学習用)
混合/保存精度 = bf16/bf16
オプティマイザ = AdEMAMix(32bitでVRAM消費)
UNet学習率 = 2e-4
TE学習率 = 1e-4
スケジューラ = inverse_sqrt(ウォームアップ100ステップ)
L2損失のみ使用
ステップ数
エポック = 10
合計ステップ数 = 2850
繰り返し回数 = 15(1つのコンセプトのみ)
ツール
kohya-ss GUI v24.2.0
torch 2.5.0 cu124
RTX 3060 12 GB + xformers + gradient_checkpointing
重み
UNet平均重み強度:0.015634962041489377
Text Encoder (1) 平均重み強度 Clip_L:0.011193290141749815
Text Encoder (2) 平均重み強度 Clip_G:0.010691167576002698
学習詳細(バージョン1)
データセット
- 38枚の画像(大部分は半身)
パラメータ
解像度 = 1024
バッチサイズ = 2
dim,alpha = 16,16(LoRAが十分に良ければ品質を維持するためにリサイズしない :P)
混合/保存精度 = bf16/fp16(誤って変更)
オプティマイザ = AdEMAMix8bit
UNet学習率 = 1e-4
TE学習率 = 5e-05
スケジューラ = inverse_sqrt(ウォームアップ100ステップ)
huber snr(c = 0.85)
ステップ数
エポック = 10
合計ステップ数 = 2850
繰り返し回数 = 15(1つのコンセプトのみ)
full_bf16学習
ツール
kohya-ss GUI v24.2.0
torch 2.5.0 cu124
RTX 3060 12 GB + xformers + gradient_checkpointing
重み
UNet平均重み強度:0.008335085569112463
Text Encoder (1) 平均重み強度 Clip_L:0.0073367764333498705
Text Encoder (2) 平均重み強度 Clip_G:0.005826970830639767
説明元:Gtonero
*このLoRAは新しい技術でLoRA学習を研究するためのものです。VTuberを損なう目的で使用しないでください(彼女のサポートもお願いします)。







