Wan Self Forcing Rank 16 (Accelerator)

详情

模型描述

注意 请确保下载与您所用工具匹配的正确版本😉 注意

Wan 自强制 Rank 16

此前已上传过此模型的其他版本,但它们与其他 LoRA 的兼容性较差,且其内部结构使我无法将其与 Blissful Tuner(我的高级扩展版 Musubi Tuner:https://github.com/Sarania/blissful-tuner/)配合使用。本版本是从 https://huggingface.co/lightx2v/Wan2.1-T2V-14B-StepDistill-CfgDistill 提取的 Rank 16 模型,专为与兼容采样器配合使用而设计,可实现高质量的 4 至 8 步扩散,适用于 Wan 架构模型。本版本同时提供适用于 Blissful 和 Comfy 的两个版本,仅保留最小必要参数以最大限度提升兼容性。

使用说明:
您需要使用兼容的采样器,如 LCM,设置 flow_shift = 8.0 且 guidance_scale/CFG = 1.0 —— 这意味着不使用负向提示(编辑:请参阅下方评论,了解如何在使用负向提示的同时获得更高质量)。但作为交换,您将获得卓越的画质和极快的视频扩散速度,几乎适用于任何 Wan 架构模型 —— 我亲自在 T2V、I2V 和 Skyreels V2 上测试过,效果均完美!它也兼容我尝试过的其他 LoRA:此处展示的亲吻视频使用了我的 AmorousLesbianKisses 模型制作,四轮车视频则使用了 /model/1698719/high-speed-dynamic?modelVersionId=1922492 制作!为弥补无 CFG/负向提示的不足,您可以使用提示加权。此外,若您确实需要负向提示,也可尝试仅在第一步使用较低的 CFG 值(如 1.6)。

我通常对 T2V 使用 6 步,对 I2V 使用 4 步。展示视频(832x1104@81f)在我的 4070 Ti Super 上仅耗时约 5 分钟生成,随后再用几分钟将帧率从 16fps 提升至 32fps(VFI)。请注意,我并未训练该蒸馏模型,此模型的原始贡献者是 lightx2v —— 感谢他们以宽松的许可条款发布该模型!我一直等待一个达到我质量标准的蒸馏 Wan 模型,而这正是它。在我看来,它优于 CausVid/AccVid 等其他模型。如上所述,我不仅在 T2V 上成功,也在 I2V 和 Skyreels V2 上取得了良好效果,因此很可能几乎所有基于 Wan 的模型都兼容。

请注意,如前所述,此模型的其他版本此前已被上传。但我仍认为有必要发布本版本,因为上述兼容性问题,而且我的提取版本更小、更专注,以更好地兼容其他 LoRA。

P.S. 如果您想从 Wan 或其他扩散模型中提取自己的 LoRA,我所使用的脚本是 Blissful Tuner 中众多附加工具之一:https://github.com/Sarania/blissful-tuner/blob/main/src/blissful_tuner/extract_lora.py

此模型生成的图像

未找到图像。