Wan2.2 Yoshiaki Kawajiri retro anime style t2v
详情
下载文件
模型描述
河内吉明曾是Madhouse工作室的制作人、导演和角色设计师,活跃于80年代和90年代。他最广为人知的作品是担任《邪恶之城》《忍者神剑》和《德古拉猎手:血之欲望》的导演,本风格基于他早期的作品。
以下视频使用wan2.2分别以高噪声和低噪声生成,我还使用了lightx2v wan2.1 t2v lora来生成v2和v1的样本。v3仅使用基础模型(我仍建议使用蒸馏lora以加快速度)。您应该能将低噪声和高噪声lora的强度设为1,也可以适当提高。
样本生成参数:
采样器:lcm
调度器:beta
附加lora:wan2.1 t2v lightx2v
高噪声:4步
低噪声:4步
低噪声lora在配备3e-5学习率的6000 Pro Blackwell上训练约36小时。
高噪声lora训练约8小时,学习率为4e-5。技术上我训练高噪声至第32轮,但明显过拟合,最终发现第16轮效果最佳。
版本3更新:额外训练了32轮,并调整数据集以包含更多短片段。我大部分示例均未使用Lightning/FusionX/Lightx2v,以展示基础模型的能力。若您不确定,我为原始模型渲染设定的步数为20。
