Qwen Wan T2I 2K Upscale

详情

下载文件

模型描述

此工作流通过在第一阶段以低分辨率使用Qwen,提升了Wan 2.2的提示遵循能力,为低分辨率输出带来显著出色的细节。

硬件: RTX 3090 24GB

模型: Qwen Q4 GGUF + Wan 2.2 Low GGUF

端到端耗时(2K超分): 冷启动300秒,0.5MP - 1MP下为80-130秒

主要结论 - Qwen潜在空间与Wan 2.2采样器兼容

共分两个阶段:

第一阶段:(42s-77s)。Qwen在0.75/1.0/1.5MP分辨率下采样

第二阶段:(~110s):Wan 2.2 四步采样

第一阶段可支持极低分辨率。尚未测试512x512,但0.75MP可用

* 文本:在1.5倍超分时文本会丢失,但在2.0倍超分时似乎可恢复。我已包含来自Comfy Qwen博客的提示

* 风景(未测试)

* 城市景观(未测试)

室内场景(未测试)

* 人像:特写效果不佳(男性年长人物表现稍好)。全身或中景效果尚可。有趣的是,使用0.75MP可平滑面部特征,但模型过于执着于雀斑,应避免。此问题可能由u/AI_Characters在以下链接中的尝试修复:https://www.reddit.com/r/StableDiffusion/comments/1mjys5b/18_qwenimage_realism_lora_samples_first_attempt/

此模型生成的图像

未找到图像。