Three sister

詳細

ファイルをダウンロード

モデル説明

学習とテキスト編集の条件:

三人の回数が異なり、画像数も異なります。

二女と三女は回数が同じで、服の変化は三女の方が大きい。

三人の特徴が似てこないように、なるべく避け、二女の特徴記述を減らす。

長女は逆引きで詳細な内容を固定し、顔画像を固定。

二女はスタイルを固定:漢服。

三女は顔画像、半身像、全身像を固定。

当初は三人分のLORAを作成しようと考えていましたが、パラメータが非常に良く、LOSS=0.1だったものの、結局失敗作となってしまいました。そこで、低い学習率(LOSS=0.078)で長女だけを生成したところ、思わぬほど使いやすくなりました。

第二版の長女は遠景がまだ満足のいく結果とは言えませんでしたが、新しく生成した二女V2の最良版は次の通りです:erjie, three sister, hanfu。思いがけず成功しました。基本的に、画像中央にレンダリングされる最大の図形が固定ターゲットであることが判明しており、テキストはあくまで補助に過ぎません。画像やテキストが多すぎると、学習率が低下する原因になります。図形AIに何をしたいのか明確に伝えるために、訓練時の背景は白または単色が最適です。

元画像は664X1080ですが、640X768のサイズで生成すると良好な効果が得られます。

不自然な状態の場合はCFG=4に調整するか、その後のLORAリリースを待ってください。新しいモデルでは様々な角度の画像を追加し、出力の安定性を向上させる予定です。

私は当初、三人分のLORAを作成しようと考えていましたが、パラメータが非常に良く、LOSS=0.1だったものの、結局失敗作となってしまいました。そこで、低い学習率(LOSS=0.078)で長女だけを生成したところ、思わぬほど使いやすくなりました。来日には二女と三女のLORAをアップロードする予定です。

このモデルで生成された画像

画像が見つかりません。