flux_schnell_workflow_12gbvram
详情
下载文件
模型描述
目标: 使用 FLUX.1 schnell(FP8)在 12 GB VRAM 上实现更快、更节省 VRAM 的 T2I 工作流。
核心思路: 单个检查点提供 MODEL/CLIP/VAE,通过 CLIPTextEncodeFlux(T5 + CLIP-L)进行文本条件化,并使用 KSampler Advanced 进行采样。LoRAs 通过 Power LoRA Loader (rgthree) 集中注入。
依赖项 / 模型
检查点: 使用 CheckpointLoaderSimple 加载
FLUX1\flux1-schnell-fp8.safetensors(输出 MODEL/CLIP/VAE)。LoRA 注入: Power Lora Loader (rgthree)(可加载一个或多个 LoRA,每个 LoRA 可单独设置强度)。
Comfy-Core 版本: 节点属性中显示
comfy-core ver 0.3.49。
工作流(简化版)
CheckpointLoaderSimple →
MODEL、CLIP、VAEPower Lora Loader (rgthree) → 将 LoRAs 注入
MODEL和CLIPCLIPSetLastLayer(可选,此处设为
-1)→ 将调整后的CLIP传递给文本编码器CLIPTextEncodeFlux(正向) → 将 T5 句子 与 CLIP 标签 合并为
CONDITIONING(内置 Guidance 调节器)CLIPTextEncodeFlux(负向) → 可选负向条件(此处已预设,含 Guidance)
EmptyLatentImage → 起始潜变量(默认:896×1152,Batch=1)
KSampler Advanced → 采样(设置 Steps/CFG/Scheduler 等)
VAEDecode → 将潜变量解码为图像
SaveImage → 保存(前缀:
flux_schnell_fluxText_workflow_v2)
预设与建议
分辨率: 从 896×1152 开始(12 GB 安全),1024² 通常也可行。
采样器: 使用
KSampler Advanced(例如 Euler + normal 调度器)。Steps 6–8,CFG = 1.0(对 schnell/FP8 检查点至关重要)。Guidance(Flux 文本节点): 已提供;建议从适中值开始(例如 3.0–4.0)。
LoRA 强度: 起始建议 0.6–0.8;根据身份“控制力”微调。
输入
T5(句子): 简短清晰的场景描述(主体、地点/光线、氛围)。
CLIP-L(标签): 6–10 个紧凑的风格/技术标签(例如 photorealistic, soft rim light, sharp eyes, shallow DOF)。
负向(可选): 用于抑制伪影(若需保留 Logo/标题,请勿使用 “text/logo” 类负向提示)。
输出
- 由 VAEDecode → SaveImage 输出的 8 位 RGB 图像(前缀见上)。
性能(12 GB)
为何快速: FLUX.1 schnell (FP8) 经过蒸馏 → 步数少,CFG 1.0。
VRAM 提示: Batch=1,避免不必要的附加编码器,必要时以 64 像素为步长调整分辨率。
稳定性: 若出现“漂移”:在 T5 中强调关键概念(例如
...:1.3)或使用 Conditioning-Weights。
最佳实践
勿混淆: T5 = 句子,CLIP-L = 标签。
保持提示简短: T5 1–2 句 + CLIP-L 6–10 标签。
LoRA 冲突: 若风格过强 → 降低 LoRA 权重。
Logo/标题(例如 VOGUE): 负向提示中不要包含 “text/logo/watermark”。
故障排除
提示被忽略: 检查 CLIPTextEncodeFlux → CLIP 的连接路径,确保使用来自同一加载器/LoRA 路径的 CLIP。
颜色错误/溢出: 在负向提示中添加
no color cast, no neon spill,或在正向提示中使用neutral color rendering。皮肤过于平滑: 在 CLIP-L 中添加
natural skin texture, subtle film grain;必要时略微降低分辨率。

