pony conga line
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
v1.1
NoobAI-XL (NAI-XL) Epsilon-pred 1.1-Version を使用して学習され、それと互換性がありますが、より良い結果を得るには ZoinkScoob / Furry NoobAI merge を推奨します。
このバージョンには強度の要件はありません。
結果はv1.0よりもおそらくノイズが多いです。
現在は「character1 hooves on character2 butt」を使用しています。
また、「congafollows」、「congaleads」、「congacompletes」、「offscreen leader」、「offscreen completer」といったプロンプトもありますが、これらは機能しないようです。代わりに「follows」と「bipedal leaning」(および「leads」と「completes」)を含むプロンプトがより効果的かもしれません。あるいは、単にポニーの名前を列挙するだけでも良いでしょう。順序は依然として影響を与えませんが、以前のバージョンではアンダースコアが影響していました。
描画スタイルが出力され、それを避けたい場合(そのスタイルの画像は1枚だけですが、さまざまな切り抜きがあります)、強度を下げてみるか、否定プロンプトに「painting」を追加し、肯定プロンプトに「my little pony, friendship is magic」を追加してみてください。
v1.0の詳細はほぼ適用可能です。
v1.0
重要
ZoinkScoob / Furry NoobAI merge では十分に動作しますが、学習に使用されたモデル(NoobAI-XL (NAI-XL) V-Pred-1.0-Version)では動作せず、NoobAI-XLのEpsilon版でもあまり機能しないと思われます。
強度は約0.35が推奨です。0.3未満だとコンガ列が生成されず、0.4以上になるとノイズが増えます。
意図された構文(順序はあまり影響しません):conga line、pony、character1 hooves on character2、character2 hooves on character3、character3 hooves on character4、my little pony、friendship is magic
学習解像度(上位のものを試してください):
解像度、アスペクト比、数、割合
1216x832、1.46=0.67、9、43%
1600x640、2.5=0.4、7、33%
1344x768、1.75=0.57、3、14%
1472x704、2.09=0.5、1、5%
1152x896、1.29=0.8、1、5%
説明
これはOneTrainerを使用して私が作成した最初の実用的なLoRAの1つです。
OneTrainerでDDIM(Eulerはvpredの関係で動作しなかった)を使用してサンプルを生成した際、CFG 7.0、解像度1216x832、ステップ3591(エポック57)が最も良い結果を出しました。
ただし、ComfyUIでEulerまたはEuler Aを使用する場合、このステップ3024(エポック48)でも低めの強度が必要です。
学習に使用されたキャプションの例:「applejack hooves on fluttershy、rarity hooves on twilight sparkle、twilight sparkle hooves on pinkie pie、fluttershy hooves on rarity、サイドビュー、開いた笑顔、右向き、青い背景、conga line、twilight sparkleは目を閉じている、pinkie pieは目を閉じている、rarityは目を閉じている、applejackは目を閉じている、fluttershyは目を閉じている、twilight sparkleはパーティーハットをかぶっている、applejackはパーティーハットをかぶっている、rarityはパーティーハットをかぶっている、my little pony: friendship is magic、ユニコーンtwilight」
"facing left"と"facing right"は効果がないようです。
"derpy hooves"は"hooves"の影響でうまく動作しない可能性があります。
同じサイズの3〜4頭のポニーを推奨します。
OneTrainerの設定
LoRA rank:16
LoRA alpha:8.0
DoRA:オフ
最適化手法:ADAMW_8BIT
スケジューラ:CONSTANT
学習率:0.0003
バッチサイズ:4
Text Encoder 1, 2の学習:オフ
"force_v_prediction":false
マスク付き学習はオフ。
コンセプトには21枚のキャプション付き画像と1枚のキャプションなし画像、8枚のマスク、12回の繰り返し、1エポックあたり63ステップ。
少なくともいくつかのエポックでは明るさとコントラストのデータ拡張が使用されました。
ライセンス
たとえ私が許可しても、ベースモデルのライセンスで禁止されていることについては従ってください:NoobAIライセンス
