flux_schnell_workflow_12gbvram

Details

Download Files

Model description

  • Ziel: Schneller, VRAM-schonender T2I-Workflow mit FLUX.1 schnell (FP8) für 12 GB VRAM.

  • Kernidee: Ein einziger Checkpoint liefert MODEL/CLIP/VAE, Textkonditionierung über CLIPTextEncodeFlux (T5 + CLIP-L) und Sampling mit KSampler Advanced. LoRAs werden zentral per Power LoRA Loader (rgthree) injiziert.

Abhängigkeiten / Modelle

  • Checkpoint: FLUX1\flux1-schnell-fp8.safetensors über CheckpointLoaderSimple (liefert MODEL/CLIP/VAE).

  • LoRA-Injection: Power Lora Loader (rgthree) (ein/mehrere LoRAs, Strength pro LoRA).

  • Comfy-Core Version: Nodes zeigen comfy-core ver 0.3.49 in den Properties.

Graph (vereinfacht)

  1. CheckpointLoaderSimpleMODEL, CLIP, VAE

  2. Power Lora Loader (rgthree) → injiziert LoRAs in MODEL + CLIP

  3. CLIPSetLastLayer (optional, hier mit -1) → gibt angepasstes CLIP an die Text-Encoder weiter.

  4. CLIPTextEncodeFlux (positiv) → kombiniert T5-Satz + CLIP-Tags zu CONDITIONING (Guidance-Regler vorhanden).

  5. CLIPTextEncodeFlux (negativ) → optionales Negativ-Conditioning (hier vorbereitet, Guidance vorhanden).

  6. EmptyLatentImage → Start-Latents (Standard: 896×1152, Batch=1).

  7. KSampler Advanced → Sampling (Steps/CFG/Scheduler etc.).

  8. VAEDecode → Decodiert Latents zu Bild.

  9. SaveImage → Speichern (Prefix: flux_schnell_fluxText_workflow_v2).

Voreinstellungen & Empfehlungen

  • Auflösung: 896×1152 start (12 GB-safe), 1024² oft möglich.

  • Sampler: KSampler Advanced (z. B. Euler + normal Scheduler). Steps 6–8, CFG = 1.0 (wichtig für schnell/FP8-Checkpoints).

  • Guidance (Flux-Textnode): vorhanden; moderat (z. B. 3.0–4.0) beginnen.

  • LoRA-Stärke: 0.6–0.8 als Start; je nach Identitäts-“Grip” feinjustieren.

Eingaben

  • T5 (Sätze): kurze, klare Szenenbeschreibung (Subjekt, Ort/Licht, Mood).

  • CLIP-L (Tags): 6–10 kompakte Stil/Technik-Tags (z. B. photorealistic, soft rim light, sharp eyes, shallow DOF).

  • Negativ (optional): Artefakt-Bremsen (keine “text/logo”-Negatives, wenn Logos/Titel gewünscht sind).

Ausgabe

  • 8-bit RGB-Bild aus VAEDecode → SaveImage (Prefix s. oben).

Performance (12 GB)

  • Warum schnell: FLUX.1 schnell (FP8) ist distillt → wenige Steps, CFG 1.0.

  • VRAM-Tipps: Batch=1, keine unnötigen Zusatz-Encoder, ggf. Auflösung in 64-px-Schritten anpassen.

  • Stabilität: Falls “Drift”: wichtige Konzepte in T5 hervorheben (…:1.3) oder Conditioning-Weights nutzen.

Best Practices

  • Nicht vertauschen: T5 = Sätze, CLIP-L = Tags.

  • Prompt kurz halten: 1–2 Sätze T5 + 6–10 Tags CLIP-L.

  • LoRA-Konflikte: Bei zu starker Stilprägung → LoRA-Weight senken.

  • Logos/Titel (z. B. VOGUE): Negatives ohne “text/logo/watermark”.

Troubleshooting

  • Prompt wird ignoriert: Prüfe Verkabelung CLIPTextEncodeFlux → CLIP aus demselben Loader/LoRA-Pfad.

  • Falsche Farben/Spill: in Negatives no color cast, no neon spill oder im Positiv neutral color rendering.

  • Zu glatte Haut: in CLIP-L natural skin texture, subtle film grain; ggf. Auflösung leicht senken.

Images made by this model

No Images Found.