Zeroscope V2 576w (txt2video)

세부 정보

파일 다운로드

모델 설명

멈추세요! 이 모델들은 txt2img 추론용이 아닙니다!

이 모델들을 stable-diffusion-webui/models 디렉토리에 넣고 이미지를 생성할 수 있다고 기대하지 마세요!

그렇다면 이 모델들은 무엇인가요?

이 모델들은 16:9 비디오 구성물을 생성하도록 최적화된 Modelscope 기반의 txt2video 모델입니다. 24fps, 576x320 해상도로 9,923개의 비디오 클립과 29,769개의 태그된 프레임으로 학습되었습니다.

이 모델들이 훨씬 더 나아 보일 수 있음을 참고하세요. 저는 Civitai에 업로드하기 위해 mp4 출력물을 gif로 변환해야 했습니다. 또한, 현재 업로드 중인 Zeroscope v2 XL txt2vid 모델을 사용하여 이 비디오를 업스케일할 수도 있습니다.

참고: 이 모델은 XL 버전(여기서 이용 가능)의 가벼운 버전이며, XL 버전은 훨씬 더 많은 VRAM을 필요로 합니다. VRAM이 15GB 이상 있다면 XL 버전을 사용해야 합니다.

어디에 넣어야 하나요?

\stable-diffusion-webui\models\ModelScope\t2v 폴더에 넣으세요.

다운로드 후 text2video_pytorch_model.pt 파일의 확장자를 반드시 .pth로 변경해야 합니다.

파일 이름은 각각 open_clip_pytorch_model.bintext2video_pytorch_model.pth여야 합니다.

누가 만들었나요? 원본 출처는?

https://huggingface.co/cerspense/zeroscope_v2_576w

무엇이 더 필요하나요?

이 모델들은 txt2video Auto1111 WebUI 확장 프로그램과 전용으로 사용하기 위해 개발되었습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.