SDXL sufficient nudity for Unstable YamerMIX
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
テキスタイルなし(裸)の女性型人間を描かなければならない。
私のギャラリーの画像はすべてヒト・サピエンスではないが、AmourAngels、Metart、Rulsky-Artで見られる20〜22歳の完全に健康な女性に似ている。
10〜12歳の典型的な女子生徒がどう見えるかを思い出せない人のために説明すると、彼女たちは中程度または「小ぶり」な胸を持ったICBNPレンダーのような外見をしていない。しかし、ホルモン豊富な肉やファストフード、高いストレスの影響を受ければ、彼女たちはより早く大人っぽく見えるようになる可能性がある。
使用方法:
チェックポイント v5 之后にこのLoRaを接続してください:SDXL Unstable Diffusers ☛ YamerMIX /model/84040/sdxl-unstable-diffusers-yamermix
v8でもそれなりに動作するが、子供のような顔を生成しやすくなる。なお、v5であっても私の最高品質のレンダーはCivitaiで1ヶ月後に削除された可能性が高い。おそらく18〜20歳のティーンエイジャーを嫌う人が多いのだろう。
Dream Shaper alpha2や他のほとんどのモデルでは動作しない。SDXL1.0で学習されているにもかかわらず。
v0.2のモデルとCLIPの強度を0.7–0.9に設定。v0.1の場合は0.6–0.8(構図に合わせるため、CLIPの強度を0.25–0.3に下げ、モデルの強度を0.7–0.75以上に設定すると裸体がより自然に描かれる)。写真用はCFG 3–6、アニメ用はやや高めに。DPM++2m SDEはより詳細な構図を生成するが、スケジューラ(kerras、exp)を忘れずに設定。
v0.2には特別なタグは不要。1girl(過剰に注目されることがある)、girl、またはタグをまったく使わない。
v0.1では、異なる顔立ちの女性を引き出すために以下のアクティベーションワードを使用(または使用しない):
g01tt = 一般的なタグで、ほとんどの結果を改善
g3475、g151a、g159a = 特定のキャラクター向けだが、現在モデルは過小学習状態であり、ほとんど影響なし
pussy、vagina = しばしば大幅に改善される
負のプロンプトで以下の要素を回避(例画像を参照):
- 複雑な負のプロンプト:
out of frame, lowres, text, error, cropped, worst quality, low quality, jpeg artifacts, duplicate, wrong proportions, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck, username, watermark, signature, bad hands, (low quality, worst quality:1.3), backlit, corrupted image, letters, words, censored, multiple fingers, multiple legs, bad hands, blur, pixelated, bad anatomy, cropped hands, artist name, extra digit, loli, fewer digit, author name, names, autograph, hand writing, written text, five legs, five legs, 3 legs, three legs, five legs, 5 legs, bad hands, bad legs, bad body shape, multiple tails, two tails, deformated body, imperfect painting, blurry hands, blurry face, blurry body, blurry image, bad eyes, ugly face, ugly eyes, repetition, ugly body
および
cartoon, comics, anime,
- 明確な負のプロンプト:
(deformed, distorted, disfigured:1.3), poorly drawn, bad anatomy, wrong anatomy, extra limb, missing limb, floating limbs, (mutated hands and fingers:1.4), disconnected limbs, mutation, mutated, ugly, disgusting, blurry, amputation. tattoo, grayscale, frame, border
および
cartoon, comics, anime,
- 一般的な負のプロンプト:
ugly, disfigured, deformed, bad anatomy, comics, cartoon, anime, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, extra limbs, disfigured, deformed, body out of frame, blurry, bad anatomy, blurred, grainy, signature, draft
一部のポーズには以下の負のプロンプトも必要:
(extra legs, vaginal penetration, penis, sex,)
(データセットには約4%の該当画像が含まれている)
早期の結果:
キャラクターは裸を隠すことがなく、約25%のレンダーはそれなりに自然に見える
脚を広げるように優しく頼んだり、何かを挿入するように頼むことも可能
彼女は「SDXL Unstable Diffusers ☛ YamerMIX」が理解する程度の体のポーズを認識
もう少し調整すれば良い画像が得られる可能性があるが、現在は最高品質の1.5モデルを使ったimg2imgで品質を向上させ、安定した結果を得られる
強度を0.6から始めると、このLoRaは主に構図内で裸の少女を引き出す
欠点:
v0.2は脚を広げた姿勢とお尻に過剰に注目する。低強度でタグを使用すること
ベースモデル(YamerMIX v5)の影響で、過剰な笑顔やアニメ/CGスタイルになりやすく、負のプロンプト(comics, cartoon, anime)で補正するのが難しい
脚の本数が間違っている画像を大量に生成。適切な否定プロンプトがないと無用
ステップ数が40未満だと奇妙なアーティファクトが発生(例画像参照)
最高品質の1.5モデルよりずっと劣るが、美しい画像を生成できる可能性あり
お尻の下に変形した体が続くことが頻繁。データセット内の(タグ付けされてない?)鏡や水の反射が原因と考えられる
v0.1はほぼ常に何らかのテキストを含む
構図やキャラクターを若干不自然に劣化させる
複雑なポーズ(頭の上に脚、脚を組む、手を頬に当てるなど)を理解できない
テクニカル情報:
v0.2
バージョン説明を参照
v0.1
生涯にわたり収集した1100枚の最高品質画像を用いて学習。私の美的基準で選別・重複学習を実施し、大規模な画像セットを避けるため、1枚の人物のみを対象とした画像はより多く学習。
ベースモデルはsdXL_v10VAEFix上に学習したが、「SDXL Unstable Diffusers ☛ YamerMIX」で使用するのが最適。他のモデルで学習した結果は劣り、さらに検証が必要。
過小学習またはデータセットが広すぎる、LoRaのサイズが小さい、あるいはその他の要因の可能性あり。いずれにせよ、さらに5000ステップ学習すると結果が悪化。Prodigyプリセットを使用したが、Kohyaの全プリセットを試した。100枚の極めて高品質な画像で学習しても、各プリセットで750ステップを過ぎた時点で悪化。また、重要なタグは1000ステップまで十分に学習されない。
TODO:
より良い学習、全データセットでの学習
大規模モデル(チェックポイント)の学習
TOS(データセットには子供の顔は含まれず、撮影時の年齢は18–24歳。レンダーは18歳に設定しているが、最高品質画像はブロックされている)
SDXLリファイナーの学習を試す
より遅い学習率とcosスケジューラで再学習
データセットからテキストをクリーンアップ(現在、1枚あたり1–3分を費やしている)+テキスト関連タグを削除
低解像度画像(現在10%が768未満)をSD1.5でアップスケールし、構図とポーズの多様性を向上。アップスケールバケットは適していない可能性があるため調査が必要
単一の顔への傾向を避けるためにデータセットをより適切に正規化
