FLUX.1-dev-ControlNet-Union-Pro-2.0(fp8)

详情

模型描述

😉 FLUX.1-dev-ControlNet-Union-Pro-2.0-fp8

Hugging Face 模型卡片

参数参考指南

  • Canny(边缘检测): controlnet_conditioning_scale=0.7, control_guidance_end=0.8

  • Depth(深度图): 使用 depth-anythingcontrolnet_conditioning_scale=0.8, control_guidance_end=0.8

  • Pose(姿态): 使用 DWPosecontrolnet_conditioning_scale=0.9, control_guidance_end=0.65

  • Gray(灰度): 使用 Colorcontrolnet_conditioning_scale=0.9, control_guidance_end=0.8

文件夹结构

为 FLUX dev 和 ControlNet 工作流组织您的模型如下:

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │   └── 📄 flux-dev.safetensores         # (或 gguf)
│   ├── 📂 text_encoders/
│   │   ├── 📄 clip_l.safetensors
│   │   └── 📄 t5xxl_fp8_e4m3fn.safetensors # (或 t5xxl_fp16 或 t5xxl_fp8_e4m3fn_scaled)
│   ├── 📂 vae/
│   │   └── 📄 ae.safetensors
│   ├── 📂 controlnet/
│   │   └── 📄 FLUX.1-dev-ControlNet-Union-Pro-2.0-fp8.safetensors

注意:仅需一个 T5XXL 文本编码器——请根据您的硬件和质量/速度需求进行选择。



我的 FP8 量化解决方案

凭借有限的编程经验,我研究了量化技术,并为该模型实现了 FP8 压缩。量化后的版本完美满足我的需求,大幅降低内存消耗,同时无明显质量损失,支持全部 ControlNet 工作流。


使用量化模型

  • 支持所有原始控制类型:姿态、深度、Canny 边缘等。

  • 任意上传参考图,选择控制类型,即可以更低内存消耗生成结果。


结合 OllamaGemini 增强提示词

我使用自定义的 ComfyUI-OllamaGemini 节点 生成最优提示词。结合量化模型,构建出一套强大且内存高效的创意图像处理流水线。


高端硬件替代方案

若您拥有高性能 GPU,Shakker-Labs 提供的原始非量化模型可提供更高保真度,但会增加内存占用。


展望未来

欢迎社区反馈!若您发现这些工作流有帮助,请为本项目点个 👍 表示支持。我乐于接受合作机会,也感谢您对我的开发工作的鼓励。


欢迎在您的创意项目中自由尝试该模型——无论是内存高效的量化版本,还是原始的全精度版本!

👨‍💻 开发者信息

本指南由 Abdallah Al-Swaiti 创建:

  1. Hugging Face

  2. GitHub

  3. LinkedIn

  4. ComfyUI-OllamaGemini

如需更多工具与更新,请查看我的其他仓库。

No alternative text description for this image

此模型生成的图像

未找到图像。