Zeroscope V2 576w (txt2video)
详情
下载文件
模型描述
停!这些模型不适用于文本到图像(txt2img)推理!
不要将它们放入你的 stable-diffusion-webui/models 目录并期望生成图像!
那么这些模型是什么?
这些是基于 Modelscope 的新型文本到视频(txt2video)模型,专为生成 16:9 视频构图而优化。它们在 9,923 个视频片段和 29,769 个标注帧(24 fps,576x320 分辨率)上进行了训练。
请注意,这些模型的实际效果可能更好——我为了上传到 Civitai,不得不将 mp4 输出转换为 gif。我们还可以使用 Zeroscope v2 XL 文本到视频模型对这些视频进行上采样,我目前正在上传这些模型!
注意:此模型是 XL 版本的轻量版(点击查看),而 XL 版本需要更多的显存。如果你的显存超过 15GB,你应该使用 XL 版本。
它们应该放在哪里?
将它们放入 \stable-diffusion-webui\models\ModelScope\t2v 文件夹中。
下载后,必须将 text2video_pytorch_model.pt 重命名为 .pth 扩展名。
文件必须命名为 open_clip_pytorch_model.bin 和 text2video_pytorch_model.pth。
谁制作的?原始来源?
https://huggingface.co/cerspense/zeroscope_v2_576w
我还需要什么?
这些模型专为 txt2video Auto1111 WebUI 扩展 设计使用。
