Wan 2.1 Lightspeed

详情

模型描述

在几分之一的时间内生成 Wan 2.1 视频。

720p 和 480p 版本

推荐设置:

  • 采样器:LCM(调度器:simple 或 LTX)

  • 步数:4

  • CFG:1

  • Sigma-Shift:5

原始模型来自 Lightx2v,已转换为 FP8 量化。

☠️ 请勿使用任何额外的加速技巧或 LoRAs,否则可能破坏你的生成结果……🤬

⚠️ 提示: 模型通常严格按照你的文字生成。如果你写 “白色”,它就是白色;“半透明” 就是半透明……比如流体效果。💦 现在你知道了!🫵 半透明的白色 🤫

⬇️⬇️⬇️⬇️⬇️⬇️⬇️⬇️⬇️⬇️⬇️

已内置 Sage AttentionFlash AttentionRadial Attentionq8-kernelsgl-kernelvllm,无需手动启用!

推荐硬件配置:

8 GB 显存,32 GB 内存

采样时间:在 RTX 4070 Ti Super 上,81 帧、4 步耗时 <2 分钟。

兼容 14B LoRAs。

我通常使用 0-2 个 LoRAs,强度根据效果需求设置为 0.4-1。大多数情况下 0.7-0.9 效果最佳,不会覆盖图像原有风格。
若同时使用多个 LoRA,建议将强度稍调低至 0.3-0.6。

基本工作流示例:

参见:/model/1811161?modelVersionId=2049602

我最喜欢的 UI:

SwarmUI https://github.com/mcmonkeyprojects/SwarmUI

测试环境(我的配置):

使用此完整检查点并叠加 LoRAs,我可自由调整设置:

  • 121 帧:约 3 分钟

  • 121 帧(24 fps,动作更丰富):约 3 分钟

  • 128 帧(24 fps,动作更丰富且时长延长):约 3.5 分钟

如需:
Clip/T5-Encoder:umt5_xxl_fp8_e4m3fn_scaled.safetensors


与往常一样,您需对生成内容负责!如果您制作了违反 ToS 的内容,一旦我发现,我将立即举报。

此模型生成的图像

未找到图像。