Bowsette Lora Wan 2.2 14B T2v / I2V
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
概要
私のKo-fiページで寄付またはサブスクライブしていただけると幸いです。
(すべての資金は、さらに多くのLoRAの作成に還元されます)
これは、キャラクター「Bowsette」(アニメーションおよび実写)を生成するために使用されるキャラクターローラです。NSFWな内容もほぼ問題なく生成可能ですが、現在のバージョンは裸体データでトレーニングされていません(次のバージョンでそのデータを追加トレーニングする予定です)。非常に多機能で、Causvid LoRAを含む他のLoRAとも良好に連携します(使用する場合は12ステップ、CFG 1、SLG/TeaCacheを無効にすることをお勧めします)。t2v 14Bモデルでトレーニングされているため、i2vモデルLoRAとしても動作します。
このバージョン(2.2 WAN 14B)について
高解像度および低解像度のWAN 14 T2Vモデルの両方でトレーニング済みです。
詳細な説明は省略します。WAN 2.2が最初に公開された際、3回試行しましたが、常に悪質な出力が出ていました。その経験から学んだこと:
高解像度モデルはキャラクターローラにとって非常に重要です。ベースモデルが学習していない要素がある場合、その要素を高解像度モデルで学習させなければ正しく生成できません。よく耳にするアドバイスとは矛盾しますが:キャラクターの外見(リアルな人物の顔)を再現するには、高解像度モデルを「アンダートレーニング」すべきですが、Bowsetteのように「新しい概念」を学習させたい場合は、十分にトレーニングされた高解像度モデルが必要です。
両方のモデルは約100エポックでトレーニングしました。ステップ数は記憶にありませんが、おそらく各10,000ステップ程度でしょうか?低解像度モデルは3回トレーニングを試みましたが挫折しました。その後、直前の2つのLoRAのトレーニングでWAN手法を学び、問題の原因を特定しました。
高解像度モデルのエポック50とエポック100では、出力結果が異なります。エポック50の高解像度モデルでは、以下のような要素を正しく生成できませんでした:
・顔とピンクの天蓋を持つ金の王冠、
・前髪が3本に分けられた髪型、
・胸元の宝石の配置。
したがって、低解像度モデルが細部を補完するために、高解像度モデルでこれらの基本的な構成を正しく生成することが不可欠です。
このバージョンは2.1版と同じデータセットでトレーニングされており、私が初めて試みたキャラクターローラの一つです。今後、キャプションを見直し、王冠や角、髪型などの要素を自動的に生成されるようキャプションから削除すべきだと考えています。このLoRAは2.1版と同様に動作するため、「live action」とプロンプトに入力し、ネガティブに「animated」を指定すれば実写版が生成され、逆に「animated」と指定して「live action」をネガティブに入れればアニメ版が生成されます。
一部の生成結果がぼやけているのは、趣味で併用したGurren Lagann LoRAの設定の影響です。今後、より多くの例を追加する予定です。ただ、このLoRAを公開して次の作業に移りたいのです。
使用推奨設定: dpm++_sde CFG 3.5 + 5シフト(6~8シフトも可能)、高解像度と低解像度のステップを11/9に分割。有効化するためのプロンプトタグについてはメインページの注意事項をご覧ください。
旧バージョン 2.1 について
V1とV1.1の違い(両方とも良いです):
V1はアニメスタイルへの切り替えがより容易です
V2は追加のNSFWデータでトレーニングされており、デフォルトで実写スタイルを生成しがちですが、プロンプトに数語追加することで修正可能です(トリガーワード参照)
必須トリガーワード: BowsetteLORA, Bowsette
推奨強度: 1.0
(プロンプティングの詳細は下記参照)
データセット
Bowsetteのみ51枚の画像(実写コスプレ写真およびファンアート)から構成される均等なデータセット。V1.1には追加で7枚のNSFW画像と2倍のトレーニングステップが含まれています。
解像度: 512x768
主なトリガーワード
必須トリガーワード: BowsetteLORA, Bowsette
スタイル用オプショントリガーワード: animated, live action
私は通常、プロンプトの冒頭に「BowsetteLORA」を配置し、以降は「Bowsette」と呼びます。
アニメスタイルを生成するには「animated」または「anime」、実写スタイルを生成するには「live action」を用いてください。ただし、トレーニングデータはコスプレイヤーの衣装を使用しているため、実写スタイルでは通常プロフェッショナルなコスプレ風になります。3D CGIスタイルも対応できます。
V1.1におけるアニメスタイルの補足:
V1.1ではアニメスタイルを出力するために追加のプロンプトが必要な場合があります。ポジティブプロンプトの末尾に以下を追加してください:
anime style, highly detailed traditional animation, 2D character, bright lineart, stylized lighting
また、ネガティブプロンプトには以下を追加してください:
realistic, photo, photorealistic, live action, skin pores, DSLR
オプションの記述トリガーワード
「Bowsette」とだけ指定するだけで、王冠や角などの一般的な要素は自動的に含まれますが、衣装や外見の特定の要素が生成されない場合や、意図的に追加したい場合は、明示的にプロンプトに入れることを推奨します(例:髪の色が白と黄色で異なるなど)。彼女のすべての要素がキャプションに記述されているため、簡単に変更できます。以下にプロンプティングの参考用語を示します(例:「Her tail」や「Green shell on back visible」というように指定すると、それらを反映できます)。ベースモデルや他のLoRAで使用可能な衣装にも彼女を着せることができます。また、ネガティブにこれらの要素を指定することで、特定のパーツを除外することも可能です。
キャラクターの特徴
髪: 金髪
耳: 長く、尖ったエルフのような形
目: 大きく、明るい青色、濃いアイラインが施されている
口/歯: 尖った大きな歯が見える開いた笑顔
爪: 長く、黒く、尖っている
顔の表情: いたずらっぽく、狡猾で、自信に満ち、あるいは狂気的な様子
イヤリング: 青い涙滴型、円形のピアス、または大きな球体
王冠: 金で、ピンクのドーム型トップ、赤い宝石が特徴的。星やハートのエンブレムが付くこともある
角: 2本の大きな滑らかで上にカーブした角(薄茶または白)、髪の生え際から生えている
殻: 背中に緑のトカゲのようなトゲのある甲羅、白い縁取りと薄茶または白の尖ったトゲ
尾: オレンジまたは茶色の分厚い爬虫類の尾、等間隔に薄茶または灰色のトゲが並ぶ
衣装の要素
トップ: 黒のストラップレスバストイアまたはボディスーツ、ハート型の首元、ビニールまたはレザー風の素材、中央にオーバル型の宝石(通常は青または緑)
ボトム: 高切りレオタード、短いプリーツスカート、透けるフローリングスカート、またはラッフル層付きスカート
ストッキング: 黒の太ももハイストッキング(透けまたは不透明)、パターン入りや太い上部バンドあり
靴: ヒール付きサンダル、スティレット、またはブーツ—多くの場合、スパイク付きの足首ストラップ付き
ネックウェア: 銀のスパイク付き黒のチョーカー
アームウェア: 黒のスパイク付きリストバンドおよびスパイク付きアームレット。時には肘まで伸びる輝く長手袋
トレーニング情報
3090 GPU上でDiffusion Pipeを使用してローカルでトレーニング。
デフォルト設定の例外:
LR 2e-5、Repeats 5、transformer dtype float8、save_dtype bfloat16、blocks_to_swap 8
ステップ数:V1は1400ステップ(エポック22)、V2は2700ステップ(エポック41)
「training data」フォルダ内にすべてのキャプションと例のワークフローを添付しました。
すべての画像はBirmeウェブサイトで切り抜き・リサイズし、GIMPで透かしやテキストを削除した後、5枚ずつのバッチでGoogleのGemini 2.5 Proに投入しました(画像キャプションの精度が非常に高いです)。seruva19さんのプロンプトをベースに、Geminiと組み合わせてすべてのキャプションを生成しました。衣装、スタイル、デザインの柔軟な変更が可能になるよう、詳細なキャプションを目指しましたが、王冠やスパイク付きブレスレットなどの基本要素は維持するようにしました。最初のプロンプトを調整した後、キャプションの精度は驚異的で、修正はほとんど必要ありませんでした。ただし、約40枚を超えると文脈が過剰になり、再プロンプトが必要になりました。手動で作業した部分が多かったですが、自動化も可能でしょう。しかし、私はそれほど苦痛を感じませんでした(約2~3時間かかりましたが、以前作成した「penis LoRA」のキャプション作業よりはるかに楽でした)。
キャプションの例
BowsetteLORA、淡い温かみのあるピンクの無地の背景。実写のBowsetteは、高い位置でまとめられたボリュームのある金髪。ピンクの宝石が見える、紫のドーム型トップの金の王冠を着用。髪の生え際から、滑らかで薄茶色の2本の大きな上向きにカーブした角が生えている。青い球体のイヤリングを着用。首には、銀のスパイクが付いた黒のチョーカー。装いは、シルバーの縁取りが施された黒く光沢のあるストラップレスボディスーツ。肘より長い黒手袋で、上部にシルバーのボタンと前腕部に白いスパイクが刻まれている。黒の太ももハイストッキングは、上部に白いスパイクバンドが付いており、黒のスティレットヒールを履いている。背中には、白い縁取りと長く尖った白いトゲを持つ緑の甲羅。甲羅の下から、白い尖ったトゲが並ぶ分厚く、ふわふわした黄色の尾が伸びている。体を少し横に向け、片手を爪のように上げ、カメラを見つめている。全身ショット。
大きな感謝
いつも同様、seruva19、Ghibli、Red LineのLoRAおよびトレーニングデータは、私の継続的なインスピレーションと知識の源です。
トレーニングに関する疑問にいつも答えてくれるBanodoco Discordコミュニティに感謝します。
素晴らしいノードとその使用方法に関するアドバイスをくれたKijaiに感謝します。
