The Muses (5 in 1) (Disney's Hercules)
詳細
ファイルをダウンロード
モデル説明
V10 Disney Muses
TL;DR: ディズニーの『ヘラクレス』に登場する5人のミューズを1つのLoRAにまとめました。キャラクターは切り抜いて個別に学習されているため、1人ずつプロンプトを指定するとより良い結果が得られます。LoRAは衣装の一般化が苦手なので、デフォルトの衣装は避けることを推奨します。
推奨重み:0.6–1.1
すべての画像はComfyUIでAutismMixとPatchModelAddDownscaleを使用してレンダリングされており、2人(または噴水)が登場する画像ではリージョナルプロンプトを使用して出力を制御しています。
タグ
衣装タグとscreenshotタグは非常に強力です。キャラクターがリアルすぎたり、汎用的すぎたりする場合は、ポジティブプロンプトにscreenshotを追加してみてください。
推奨ネガティブタグ
bad eyes, bad lips, orange skin
キャラクタータグ
calliope, brown eyes, black hair, white headband
terpsichore, brown eyes, black hair
clio, brown eyes, black hair, ponytail over shoulder
melpomene, brown eyes, black hair
thalia, brown eyes, black hair, short hair, high ponytail, white hair tie
衣装+キャラクタータグ
calliope, brown eyes, black hair, white headband, white chiton dress, side slit, white arm drapes, white high heels, dark red lipstick, dark red eyeshadow
terpsichore, brown eyes, black hair, white frilled crop top, white skirt with train, white arm drapes, white high heels, dark red lipstick, dark red eyeshadow
clio, brown eyes, black hair, ponytail over shoulder, white capelet, white chiton dress, side slit, white high heels, dark red lipstick, dark red eyeshadow
melpomene, brown eyes, black hair, white chiton dress, single shoulder strap, white single arm drape, side slit, white high heels, dark red lipstick, dark red eyeshadow
thalia, brown eyes, black hair, short hair, high ponytail, white hair tie, white chiton dress, white shoulder drape, dark red lipstick, dark red eyeshadow
学習情報
学習画像は高度に処理されています(SUPIR、ESRGANx4plus_anime、手動編集)。
バッチサイズ = 4
Thalia
- screenshot: 15(x3繰り返し)
- ファンアート: 8(x3繰り返し)
Clio
- screenshot: 14(x3繰り返し)
- ファンアート: 7(x3繰り返し)
Calliope
- screenshot: 36
- ファンアート: 6(x3繰り返し)
Melpomene
- screenshot: 16(x3繰り返し)
- ファンアート: 8(x3繰り返し)
Terpsichore
- screenshot: 18(x3繰り返し)
- ファンアート: 6(x2繰り返し)
備考
- 瞳の色、(ほとんどの)キャラクターの基本的な髪型、赤い髪のハイライト/アウトラインは意図的にラベル付けされていません。
- 濃い肌色は明示的にタグ付けされておらず、制御が難しいです。オレンジ色の肌への強いバイアスがあるようです。
- 「arm drapes」と「skirt with train」(正しくは「train (clothing)」?)というタグは十分に学習されていません。画像からはこれらの詳細を削除するか、これらの概念の補完データセットを作成して追加すべきでした。
- プロップ(悲劇の仮面、巻物、羽の扇、花瓶など)は明示的に学習されていません。
- 5人同時のグループショットは学習されておらず、グループショットでの相対的な身長の学習に悪影響を与えています。
- Thaliaの体型は映画のものほどスタイル化されていません。
- 「screenshot」タグを削除すべきか?:スタイルを制御するには有効ですが、肌色やキャラクターの細部(例:髪の渦巻き)も吸収している可能性があります。また、基本的な衣装は学習画像のほとんどに登場しているため、過学習されています。
- 化粧や服に関するタグを過剰に削除してください。リップストックとアイシャドウのタグは多すぎ、下唇が消えてしまう原因になっています。
- ウェブからのスクリーンショットではなく、映画からより良いデータを収集できたはずです。
- 髪型のラベルは明確にすべきです(例:アフロ、耳周りの尖った髪、髪のふくらみとコーン型の結い髪または髪の角、長いウェーブヘア、ハイポニーテール)。
TODO
- 肌色を修正(どうすれば?)
- arm drapesを修正
- すべてのドレープとトレインを除去したクローンセットを作成し、両方で学習
- サブデータセット
- arm drapes(肘のバンドを含めるようにする)
- train (clothing)
- 棒につけた悲劇の仮面
- 羽の扇
- 巻物
- 過剰なリップストックとアイシャドウタグを削除(画像内で十分に大きい場合のみ)
- Melpomeneの顔のアップをさらに増やす?
- Thaliaのデータの繰り返しをさらに増やす?
- グループ画像と、より緩やかな切り抜き(特にThaliaの短い身長を学習させるために)
- ファンアートを修正または追加(適切に描かれており、理想は高品質な)して、データセットをバランスよくする。正則化として、異なる衣装を含めるのが望ましい。
- 歯と目を修正(例:二重歯、悪い目、悪い手など)
- 「screenshot」の用語を削除すべきか?:汚いアップスケールされたアニメーションを除去する効果はあるが、キャラクター設計の一部も吸収している可能性がある。


















