Image to Video with CogVideoX-Fun Working in Low VRAM

세부 정보

파일 다운로드

모델 설명

저는 이 워크플로우를 작성했습니다. 12GB VRAM이 있다면 매우 빠르게 렌더링됩니다. 8GB 이하의 VRAM을 보유하고 있다면 5b 대신 CogVideoX-Fun 2b 모델을 선택하세요.

크레딧: https://comfyuiblog.com/image-to-video-with-cogvideox-fun-working-in-low-vram/

CogVideoX-Fun은 CogVideoX 구조를 기반으로 수정된 파이프라인으로, 생성 과정에서 더 큰 유연성을 제공하도록 설계되었습니다. AI 이미지 및 동영상을 생성할 수 있을 뿐만 아니라 Diffusion Transformer를 위한 베이스라인 모델과 LoRA 모델을 학습하는 데 사용할 수 있습니다. 우리는 이미 학습된 CogVideoX-Fun 모델을 직접 사용하여 예측을 지원하며, 이로 인해 다양한 해상도에서 약 6초 길이(8fps, 1~49 프레임)의 동영상을 생성할 수 있습니다. 사용자는 자체 베이스라인 모델 및 LoRA 모델을 학습시켜 특정 스타일 변환을 달성할 수도 있습니다.

새로운 기능:

  • 코드 생성! 이제 Windows 및 Linux를 지원합니다. 2b 및 5b 모델을 지원하며, 256x256x49에서 1024x1024x49까지 모든 해상도에서 동영상 생성을 지원합니다. [2024.09.18

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.