Zeroscope V2 576w (txt2video)

详情

下载文件

模型描述

停!这些模型不适用于文本到图像(txt2img)推理!

不要将它们放入你的 stable-diffusion-webui/models 目录并期望生成图像!

那么这些模型是什么?

这些是基于 Modelscope 的新型文本到视频(txt2video)模型,专为生成 16:9 视频构图而优化。它们在 9,923 个视频片段和 29,769 个标注帧(24 fps,576x320 分辨率)上进行了训练。

请注意,这些模型的实际效果可能更好——我为了上传到 Civitai,不得不将 mp4 输出转换为 gif。我们还可以使用 Zeroscope v2 XL 文本到视频模型对这些视频进行上采样,我目前正在上传这些模型!

注意:此模型是 XL 版本的轻量版(点击查看),而 XL 版本需要更多的显存。如果你的显存超过 15GB,你应该使用 XL 版本

它们应该放在哪里?

将它们放入 \stable-diffusion-webui\models\ModelScope\t2v 文件夹中。

下载后,必须text2video_pytorch_model.pt 重命名为 .pth 扩展名。

文件必须命名为 open_clip_pytorch_model.bintext2video_pytorch_model.pth

谁制作的?原始来源?

https://huggingface.co/cerspense/zeroscope_v2_576w

我还需要什么?

这些模型专为 txt2video Auto1111 WebUI 扩展 设计使用。

此模型生成的图像

未找到图像。