Furry + nsfw wan 2.2 5b
详情
下载文件
关于此版本
模型描述
V2
V2 更加一致,运动更稳定,且产生的伪影更少。它对于 2D 输入似乎也表现得非常好。所有预览均使用同一提示词生成,无论是文本到图像(t2i)还是图像到视频(i2v);若分别编写提示词并选择良好的起始图像,效果会更好。
仅用 4 步即可使用 "turbo" LoRA 生成高质量视频!
该 turbo LoRA 可在 Hugging Face 上获取:https://huggingface.co/Kijai/WanVideo_comfy/blob/main/LoRAs/Wan22-Turbo/Wan22_TI2V_5B_Turbo_lora_rank_64_fp16.safetensors
使用方法:将步数设为 4,CFG 值设为 1。我不确定推荐的采样器/调度器是什么,但我已在多个采样器和调度器上获得了极佳的效果。我个人使用 euler/euler a + beta 调度器。
在略低的分辨率下(但不至于显著降低画质),我可以在 3060 显卡上仅用 2 分钟生成 80 帧。
该 LoRA 推荐用于 i2v,但 t2v 也可能表现不错。
该 LoRA 在我新构建的混合毛茸茸生物/人类数据集上训练而成,该数据集的旧版本也曾用于实验性和半稳定文本到视频的 LoRA。
提示词撰写
提示词应使用自然语言。你需要生成 720p 分辨率的视频,因此例如 1280x704、704x1280 或 960x960 均为有效尺寸。这一点对于 i2v 可能比 t2v 更重要,我注意到 i2v 中会出现伪影。
在提示词中,你可以描述为“3D 动画”、“2D 动画”或“真实视频”,这对 t2v 尤其有用,也可能对 i2v 有帮助。
你也可以参考示例视频中的提示词以获取更多信息。