Zeroscope V2 576w (txt2video)
세부 정보
파일 다운로드
모델 설명
멈추세요! 이 모델들은 txt2img 추론용이 아닙니다!
이 모델들을 stable-diffusion-webui/models 디렉토리에 넣고 이미지를 생성할 수 있다고 기대하지 마세요!
그렇다면 이 모델들은 무엇인가요?
이 모델들은 16:9 비디오 구성물을 생성하도록 최적화된 Modelscope 기반의 txt2video 모델입니다. 24fps, 576x320 해상도로 9,923개의 비디오 클립과 29,769개의 태그된 프레임으로 학습되었습니다.
이 모델들이 훨씬 더 나아 보일 수 있음을 참고하세요. 저는 Civitai에 업로드하기 위해 mp4 출력물을 gif로 변환해야 했습니다. 또한, 현재 업로드 중인 Zeroscope v2 XL txt2vid 모델을 사용하여 이 비디오를 업스케일할 수도 있습니다.
참고: 이 모델은 XL 버전(여기서 이용 가능)의 가벼운 버전이며, XL 버전은 훨씬 더 많은 VRAM을 필요로 합니다. VRAM이 15GB 이상 있다면 XL 버전을 사용해야 합니다.
어디에 넣어야 하나요?
\stable-diffusion-webui\models\ModelScope\t2v 폴더에 넣으세요.
다운로드 후 text2video_pytorch_model.pt 파일의 확장자를 반드시 .pth로 변경해야 합니다.
파일 이름은 각각 open_clip_pytorch_model.bin과 text2video_pytorch_model.pth여야 합니다.
누가 만들었나요? 원본 출처는?
https://huggingface.co/cerspense/zeroscope_v2_576w
무엇이 더 필요하나요?
이 모델들은 txt2video Auto1111 WebUI 확장 프로그램과 전용으로 사용하기 위해 개발되었습니다.
