YiffyMix

詳細

ファイルをダウンロード

モデル説明

e621タグ(アンダースコアなし)、YiffyMixではアーティストタグが非常に効果的です。

GridList Species/Artist(v61) update!! および LoRAs (SDXL)/samples/wildcards

新規ユーザー向けにアーティストリスト(Noob XL) を推奨。ComfyUIワークフロー も参照。

YiffyMixではPonyスコアタグは必要なく、SDXLでSD1.5 VAEを使用しないでください。そうすると過剰なノイズが発生し、画像が「焼きついた」ようになります。

例の設定

SDXL(SDXL-lightning および NoobXL)の設定

  • ステップ数 = 12~24
  • サンプラー = "DDPM", "Euler A SGMUniform", "Euler SGMUniform"
  • CFGスケール = 4
  • ネガティブエムベッディング SDXL = ac-neg1, ac-neg2(実際は必要ない)
  • ポジティブLoRA SDXL = SeaArt Quality Tags LoRA(実際は必要ない)
  • CLIPレイヤーで停止 = 2

SD 1.5 + vpred の設定

  • ステップ数 = 30~40
  • サンプラー = "DPM++ 2M Karras", "DPM++ SDE Karras", "DDIM", "UniPC"
  • CFGスケール = 6~8
  • ネガティブエムベッディング = deformity_v6, bwu [SD-WebUI\embeddings]
  • CLIPレイヤーで停止 = 1
  • Etaノイズシードデルタ = 0
  • SD VAE = kl-f8-anime2, Furception [SD-WebUI\models\VAE]

ハイレゾ修正(Hires. fix)

  • ハイレゾステップ数 = ステップ数 × ノイズ強度
  • ノイズ強度 = 0.25
  • ハイレゾアップスケーラー = 4x-UltraMix_Smooth [SD-WebUI\models\ESRGAN]

ControlNet

Wan 2.2 ComfyUIアニメ化 [ワークフロー]

SD WebUI

LoRAトレーニング SDXL

  • 画像数 = 15~50
  • 総ステップ数 = エポック × 画像数 × フォルダーループ = 3000~4500
  • network_dim = 64
  • network_alpha = 128(SDXL)\ 16(Noob)
  • 学習率 = 0.0002~0.0005
  • unet_lr = 0.0001 #学習率/2
  • text_encoder_lr = 0.00005 #学習率/4
  • lr_scheduler = "cosine_with_restarts"
  • mixed_precision = "bf16"
  • optimizer_type = "Adafactor"
  • optimizer_args = [ "scale_parameter=False", "relative_step=False", "warmup_init=False", ]

YiffyMix v4x V-pred 設定

# YiffyMix v4x A1111 SD-WebUI または Forge V-pred 設定

  1. 設定ファイル ".yaml" をダウンロードし、モデルと同じ場所に貼り付けます。
  2. ファイル名をモデル名と同じに変更します(".yaml"ファイルに [parameterization: "v"] の行があることを確認)。
  3. SD-WebUIを再起動します(設定の読み込みに失敗した場合、モデルはノイズを生成するだけです)。

# YiffyMix v4x ComfyUI または StableSwarmUI V-pred 設定

ノード「ModelSamplingDiscrete」を追加し、Sampling = "v_prediction" に設定してください。

ワークフローデモ

# ComfyUI V-pred 設定(古いバージョン)

  1. 設定ファイル".yaml"を [ComfyUI\models\configs] にコピーし、ComfyUIを更新してください。
  2. 「Load Checkpoint (With Config)」[右クリック→AddNode→advanced→model_merging]

ワークフロー: [Load Checkpoint (With Config)] - [KSampler] - [VAE Decode] - [Save Image]

# v-predモードのトラブルシューティング

新しいバージョンの webui-forge を使用していて、v-predモデルの検出に失敗した場合、webui-forgeの更新(update.batをクリック)を試してください。

v-predモデルを読み込む際に、CMDコンソールで以下の行が表示されます:

left over keys: dict_keys(['v_pred'])

# v4.xでは時々若干焼きついた画像が出ることがある場合

「Dynamic Prompts with __wildcards__ prompts」を使用し、バッチサイズ > 1 に設定してください。

同じプロンプトとパラメータで再生成すれば、通常の画像になります。

バージョン情報

v1.x [2D,512~768] 過去のモデル、不安定、低解像度

v2.x [2D,512~896] e621データセット+SD5データセットの30~40%

v3.0 [2D,3D,512~1088] v2.xより大きなデータセット、2D・3D両方に対応可

v3.1 [2D,3D,リアル,512~1088]

よりリアルに仕上がりますが、概念の一部が損なわれ、e621タグ数が約1000程度削減されています。

v3.2 [2D,3D,リアル,512~1088]

不安定バージョン、SNRバージョン「FluffyRock」を使用、ノイズの詳細が増加。

v3.3 [2D,3D,リアル,512~1088]

安定バージョン、詳細が増加、プロンプトに敏感。

v3.4 [2D,3D,リアル,512~1088] ※Fluffy Rock Quality Tags-LoRA含む

安定バージョン、詳細が増加、結果が明確、ノイズ(例:木、柄)を軽減。

v3.5 [2D,3D,リアル,512~1088]

不安定バージョン、コントラストと詳細が向上。

v3.6 [2D,3D,リアル,512~1088]

安定バージョン、e621タグに対してより敏感。

v3.7 [2D,3D,リアル,解像度:512~1088,VAE埋め込み]

安定バージョン、ノイズの過剰発生を低減、ぼんやりした目や指のエラーを修正、バックグラウンド深度の失敗を修正。

v4.0 [2D,3D,リアル,512~1088,VAE埋め込み]

v-predバージョン、EasyFluff からリミックス。

少ないプロンプトで正確な解剖学とスタイルを再現。平均色が多少青みがかった薄い色調、滑らかなノイズ、弱いネガティブプロンプトの問題。

v4.1 [2D,3D,リアル,512~1088,VAE埋め込み]

v-predバージョン、色調と低コントラスト修正、リアルなノイズが減少。

v4.2 [2D,3D,リアル,512~1088,VAE埋め込み]

v-predバージョン、コントラストと詳細が向上、黄色調の問題が発生。
「焼きついた」感じが強い場合は Rescale CFG を =0.35 に設定してください。

v4.3 [2D,3D,リアル,512~1088,VAE埋め込み]

v-predバージョン、アーティストスタイルが明確に、黄色・茶色の問題をほとんど修正。

このバージョンではCFG Rescaleは不要。

v4.4 [2D,3D,リアル,512~1088,VAE埋め込み]

v-predバージョン、黄色・茶色の問題なし。

このバージョンではCFG Rescaleは不要。

v5.0 [2D,3D,リアル,896~1536]

SDXL-lightningバージョン、Compassmix XLに基づく。

v5.1 [2D,3D,リアル,896~1536]

SDXL-lightningバージョン、e621データセットを多く含み、人間の顔が低くなっている、NSFWコンテンツが改善。

v5.2 [2D,3D,リアル,解像度:896~1536]

SDXL-lightningバージョン、平均品質を向上。v5.1より少し不安定だが、より創造的。

v6.0 [2D,3D,解像度:896~1536] ※NoobXL epsバージョン(v-predではない)

キャラクターのセクシーポーズが改善されるが、スタイルは限定的で制御が難しい(大抵はアニメスタイル)。

v6.1 [2D,3D,リアル,解像度:896~1536] ※NoobXL epsバージョン(v-predではない)

よりリアルなディテール、アニメスタイルを軽減、フラットで退屈なバックグラウンドを修正。

v6.1a-RE [2D,3D,リアル,解像度:896~1536] ※NoobXLリアルエナジーバージョン(RE)

v6.1と同様だが、平均スタイルをややリアルに調整。

v6.2 [2D,3D,リアル,解像度:896~1536] ※NoobXL epsバージョン(v-predではない)

より効果的なプロンプト、スタイルを保ちつつ優れたリアルなディテール、彩度はわずかに低下。

基本スタイル

Negative Prompt SD1.5

変則的な解剖、損傷、変形、水印、
障害、モザイク、スケッチ、モノクロ

Negative Prompt SDXL

変形、最低品質、不良品質、
署名、テキスト、URL

3Dアートスタイル

プロンプト:

blender (ソフトウェア)、レイトレーシング、3D、ユナイテッドエンジン

写実的スタイル

プロンプト SD1.5:

[:photorealistic, アナログスタイル, 実在性, 写実性:0.5]

ネガティブプロンプト SD1.5:

[:bwu:0.5]

推奨リファイナー:

IndigoFurryMix v110-Realistic 0.5でスイッチ

写実的スタイル SDXL

プロンプト v5x:

Mandy Disherによる、Wim Wendersによる、Robert Rauschenbergによる、[Fossa666による::0.65]、
超高精細、写実性、写真

ネガティブプロンプト v5x:

スケッチ、マンガ、ベクトル、線画、トゥーンスタイル

プロンプト v6x:

フィルムフォトグラフィー、写実的、フィルムフィルム

ネガティブプロンプト v6x:

アニメスタイル、鮮やかな配色、パステルカラー

NoobXL(v6x)に関する注意点:

"furry"タグを使用すると、AIは人間ではなくふさふさの生物を生成します。
"no human"タグを使用することで、NoobXLモデルが人間を追加し、アンソロポモーフィック(人間化)影響を減らすことができます(より原作風のスタイルに)。

一部人間的な要素を含むタグ:ドルフィン、金魚、ライオンフィッシュ、鯉、クジラ、サンゴ

ターゲットタグが効果がない場合、AIは「no human」に怪物を生成します。

a1111を用いたSDの一部テクニック([a:b:value]スクリプトプロンプト使用):

1. 高解像度の強化

[:スタイルまたはアーティスト:0.15]

最初の10%~20%のステップで自由に生成し、その後にスタイルが詳細なベース上に完成します。

2. アーティストや背景の影響によるキャラクタポーズの回避

[:アーティストまたは背景プロンプト:0.2]

最初の20%のステップをスキップすることで回避できます。

3. 「Aアーティストのキャラクター」+「Bアーティストのスタイル」

[Aアーティスト:Bアーティスト:0.35]

大部分のベースコンセプトは最初の30%~50%のステップで完了し、最後のステップはスタイルの変更のみを目的とします。

このモデルで生成された画像

画像が見つかりません。