Wan & SkyReels Text to Image Workflows
详情
下载文件
模型描述
📷 HD 图像输出 – 现已支持 ControlNet 与 Img2Img!(最高可达 2048P)
🌀 SkyReels 和 WAN – 文本转视频模型,呈现惊艳静态图像
分享我目前用于 WAN 和 SkyReels 的工作流——两者均为文本转视频模型,但也能生成令人惊叹的静态图像。
⚙️ 默认设置已表现优异,但所有参数均可调整。
📝 别忽略工作流内的注释——其中包含设置说明与实用技巧。
💡 使用低于 16GB 显存?启用模块交换以获得更流畅的运行体验。
🚀 想要更快速度?将步数降至 4。本示例使用 10 步,在 RTX 5090 上耗时约 25 秒。
🔥 经过大量测试,我发现这些模型的输出效果优于 FLUX——人脸更逼真,完全避免了 FLUX 的人脸问题。
为简化操作,你只需替换模型,无需为每个模型单独维护两个工作流。模型链接已在工作流中提供。
☕ 喜欢我的作品?支持我一下:Buy Me A Coffee 💜
每一杯咖啡都能助我产出更多免费 LoRAs 和工作流!
❓这两个工作流有何不同?
问得好!经过大量测试:
🎬 SkyReels 生成的画面更具电影感与真实感。
🌟 WAN 则更清晰锐利、冲击力强,但电影感稍弱。
不过,LoRA 的选择对输出影响极大,建议你用各自提示词尝试两种工作流,找出最契合你风格的那一个。
🚧 目前这些功能仅适用于 WAN 封装器:
🖊️ 文本转图像
🧠 ControlNet(DepthAnything、DW Pose、Canny、Lineart 等)
🖼️ 图像转图像(带去噪控制的增强/超分辨率)
✅ 原生支持现已启用 — ControlNet 与图像转图像功能即将上线!
✅ 原生 GGUF 支持现已启用 — ControlNet 与图像转图像功能即将上线!
💭 为何这些图像效果如此出色?很简单:它们是在视频数据上训练的,意味着每个概念拥有远超常规的帧数——而 WAN 是一个140 亿参数的模型,远大于 FLUX。这种规模与帧数据量在输出中显而易见。
不妨试一试,告诉我你的感受!
👉 需要帮助撰写文本转图像提示词?我专门为此制作了一个 GPT:完美文本转图像提示词生成器
试试看,告诉我你的想法!














