V3 Final! DeJanked Speed Hack Hunyuan T2V Final Boss
详情
下载文件
关于此版本
模型描述
重大升级。真正的精炼器速度破解。
DeJanked 速度破解 Hunyuan T2V 最终Boss:
你是否厌倦了你的AI视频工作流慢得像奶奶玩《青蛙过河》?是否渴望极速体验,又不想牺牲令人惊叹的画质?系好安全带,因为这不只是一套工作流——这是Hunyuan T2V优化的最终Boss。经过安慰剂破解、理智测试与菊花链魔法的重重考验,这套方案大幅缩短渲染时间,保持你的GPU呼吸顺畅,同时仍输出e-girl级的帧画面,让你怀疑现实。敢不敢试试?它快速、流畅,可能直接炸裂你的大脑(但不会炸你的GPU)。
TL/DR:
标准:180秒(高质量)
使用速度破解后:100秒(高质量)
无降采样/升采样
无Wavespeed,仅使用最少TeaCache
无XL伪优化(我感觉被坑了!详见下方测试)
这完全是另一回事(请发布你的结果)
测试部分:
Wavespeed:我不会测试它,因为它依赖Triton,而很多人在Windows上安装Triton时都会遇到困难(还可能破坏整个Windows系统……使用WSL并已安装Wavespeed的用户,大概能自行调整插入Wavespeed。本方案旨在为最广泛的用户群体提供最大兼容性。
我使用的硬件:3090 TI 24GB VRAM,64GB RAM,WSL。
100帧,10步,3步精炼器,512x512(无缩放)作为基础
目标:
- 在不损失画质的前提下寻找速度提升
- 不使用任何升/降采样
- 不用花招,仅最大化标准节点的潜力
方法:每个阶段生成三次
原生基线:
第一轮:(基础视频生成,无任何调整,仅生成+精炼)
流程:正常(无明显异常动作)
画质:高
180秒
通过
第二轮:
主模型与精炼器均使用TeaCache采样器(快速模式,1.6)
流程:正常
画质:高
172-175秒
通过
第三轮:
主模型使用TeaCache采样器(4.4,无形态),精炼器使用标准模式
画质:平均-差,精炼后稍好,但细节丢失,即使增加到4步仍未改善
流程:尚可,略有异常(可能是正常异常被放大)
154秒
失败
第四轮:
主模型与精炼器均使用快速TeaCache采样器,并引入TeaCache Thresh节点(阈值0.15)
画质:良好
流程:良好
180秒(???)
失败(与采样器可能冲突,无意义)
结论:主模型和精炼器同时使用“快速”采样器似乎是最佳平衡点。可能还可进一步测试更快设置,但当前成果已足够(多出或少几秒并非我追求的提升目标)
接下来,彻底测试XL伪优化方案,一劳永逸。
XL破解:
已删除,纯安慰剂,被削弱! 平均185秒。扔进火堆吧……(我感觉自己被坑了!)
接下来,菊花链精炼器速度破解
结果:
主模型1步 + 精炼器2步,无编解码:
100帧,9步
画质:高
流程:良好
100.34秒
如需调整画质,可微调起始步数,但5,2,2组合已产生极佳效果。建议从这里开始。
为什么有效?
我不知道,但我推测:第一步塑造形态,第二步填充细节,第三步精细优化。每一层基于前一层的输出,减少开销,无需从头开始,逐层构建。或者……是模拟宇宙和仙尘魔法……显然。
这就是全部了。如果你能找到漏洞,欢迎指出。
试试看吧,它是免费的,对我而言,它运行得快到飞起。
部分渲染会出现画面略微偏快的奇特现象(可重渲染相同种子,适当降低帧率)。
在你尝试前,请先用你正常的非异常工作流(不使用Wavespeed)进行三次基础测试,确保你的环境稳定。务必运行三次(需要时间预热缓存,第三次运行时才能达到最佳速度)。
我使用的是Hunyuan 8b 720(快速)模型,唯一激活的LoRA是来自Civitai的fastvideo LoRA,强度设为-0.30(大模型用正值,快速模型用负值)。为趣味性,我在主视频模型上额外添加了e-girl LoRA,但不属于测试部分。
警告:没有任何内容被降采样。请监控你的GPU负载。建议从较小分辨率开始,如512x512,再逐步调整(向上或向下)。这能加快渲染速度,但不会降低GPU开销。

