i2i 6GB 12GB 16GB bf16 fp8 gguf 4steps 20steps (Qwen2509 Workflow)

详情

模型描述

FP8 和 GGUF 工作流(单张图像)

  • Qwen2509_fp8_16GB_12GB_GGUF_6GB_4steps_v8 配合 Lightning LoRA

  • Qwen2509_fp8_16GB_12GB_GGUF_6GB_20steps_v8

VRAM 使用情况(第二轮)

  • 16GB:bf16(在 4070 Ti 上 50 步耗时 380 秒,显存 24GB,VAE 显存 36GB)

  • 16GB:fp8(在 4070 Ti 上 4 步耗时 25 秒)

  • 12GB:fp8 配合 DisTorch2MultiGPU

  • 6GB:Q4GGUF 配合 DisTorch2MultiGPU

  • 16GB:Q4GGUF

  • 16GB:fp8 meitu(在 4070 Ti 上 20 步耗时 160 秒)(我认为提示响应速度 2509 >> meitu)

我上传这个是因为很难找到不使用 Lightning LoRA 的工作流。

(但 Lightning 4 步效果非常好。)

此模型生成的图像

未找到图像。