Qwen Wan T2I 2K Upscale
详情
下载文件
模型描述
此工作流通过在第一阶段以低分辨率使用Qwen,提升了Wan 2.2的提示遵循能力,为低分辨率输出带来显著出色的细节。
硬件: RTX 3090 24GB
模型: Qwen Q4 GGUF + Wan 2.2 Low GGUF
端到端耗时(2K超分): 冷启动300秒,0.5MP - 1MP下为80-130秒
主要结论 - Qwen潜在空间与Wan 2.2采样器兼容
共分两个阶段:
第一阶段:(42s-77s)。Qwen在0.75/1.0/1.5MP分辨率下采样
第二阶段:(~110s):Wan 2.2 四步采样
第一阶段可支持极低分辨率。尚未测试512x512,但0.75MP可用
* 文本:在1.5倍超分时文本会丢失,但在2.0倍超分时似乎可恢复。我已包含来自Comfy Qwen博客的提示
* 风景(未测试)
* 城市景观(未测试)
室内场景(未测试)
* 人像:特写效果不佳(男性年长人物表现稍好)。全身或中景效果尚可。有趣的是,使用0.75MP可平滑面部特征,但模型过于执着于雀斑,应避免。此问题可能由u/AI_Characters在以下链接中的尝试修复:https://www.reddit.com/r/StableDiffusion/comments/1mjys5b/18_qwenimage_realism_lora_samples_first_attempt/







