flux_schnell_workflow_12gbvram
Details
Download Files
Model description
Ziel: Schneller, VRAM-schonender T2I-Workflow mit FLUX.1 schnell (FP8) für 12 GB VRAM.
Kernidee: Ein einziger Checkpoint liefert MODEL/CLIP/VAE, Textkonditionierung über CLIPTextEncodeFlux (T5 + CLIP-L) und Sampling mit KSampler Advanced. LoRAs werden zentral per Power LoRA Loader (rgthree) injiziert.
Abhängigkeiten / Modelle
Checkpoint:
FLUX1\flux1-schnell-fp8.safetensorsüber CheckpointLoaderSimple (liefert MODEL/CLIP/VAE).LoRA-Injection: Power Lora Loader (rgthree) (ein/mehrere LoRAs, Strength pro LoRA).
Comfy-Core Version: Nodes zeigen
comfy-core ver 0.3.49in den Properties.
Graph (vereinfacht)
CheckpointLoaderSimple →
MODEL,CLIP,VAEPower Lora Loader (rgthree) → injiziert LoRAs in
MODEL+CLIPCLIPSetLastLayer (optional, hier mit
-1) → gibt angepasstesCLIPan die Text-Encoder weiter.CLIPTextEncodeFlux (positiv) → kombiniert T5-Satz + CLIP-Tags zu
CONDITIONING(Guidance-Regler vorhanden).CLIPTextEncodeFlux (negativ) → optionales Negativ-Conditioning (hier vorbereitet, Guidance vorhanden).
EmptyLatentImage → Start-Latents (Standard: 896×1152, Batch=1).
KSampler Advanced → Sampling (Steps/CFG/Scheduler etc.).
VAEDecode → Decodiert Latents zu Bild.
SaveImage → Speichern (Prefix:
flux_schnell_fluxText_workflow_v2).
Voreinstellungen & Empfehlungen
Auflösung: 896×1152 start (12 GB-safe), 1024² oft möglich.
Sampler:
KSampler Advanced(z. B. Euler + normal Scheduler). Steps 6–8, CFG = 1.0 (wichtig für schnell/FP8-Checkpoints).Guidance (Flux-Textnode): vorhanden; moderat (z. B. 3.0–4.0) beginnen.
LoRA-Stärke: 0.6–0.8 als Start; je nach Identitäts-“Grip” feinjustieren.
Eingaben
T5 (Sätze): kurze, klare Szenenbeschreibung (Subjekt, Ort/Licht, Mood).
CLIP-L (Tags): 6–10 kompakte Stil/Technik-Tags (z. B. photorealistic, soft rim light, sharp eyes, shallow DOF).
Negativ (optional): Artefakt-Bremsen (keine “text/logo”-Negatives, wenn Logos/Titel gewünscht sind).
Ausgabe
- 8-bit RGB-Bild aus VAEDecode → SaveImage (Prefix s. oben).
Performance (12 GB)
Warum schnell: FLUX.1 schnell (FP8) ist distillt → wenige Steps, CFG 1.0.
VRAM-Tipps: Batch=1, keine unnötigen Zusatz-Encoder, ggf. Auflösung in 64-px-Schritten anpassen.
Stabilität: Falls “Drift”: wichtige Konzepte in T5 hervorheben (…:1.3) oder Conditioning-Weights nutzen.
Best Practices
Nicht vertauschen: T5 = Sätze, CLIP-L = Tags.
Prompt kurz halten: 1–2 Sätze T5 + 6–10 Tags CLIP-L.
LoRA-Konflikte: Bei zu starker Stilprägung → LoRA-Weight senken.
Logos/Titel (z. B. VOGUE): Negatives ohne “text/logo/watermark”.
Troubleshooting
Prompt wird ignoriert: Prüfe Verkabelung CLIPTextEncodeFlux → CLIP aus demselben Loader/LoRA-Pfad.
Falsche Farben/Spill: in Negatives
no color cast, no neon spilloder im Positivneutral color rendering.Zu glatte Haut: in CLIP-L
natural skin texture, subtle film grain; ggf. Auflösung leicht senken.

