Animatediff 3 vid2vid Openpose

세부 정보

파일 다운로드

모델 설명

사용법

입력 영상을 로드합니다. 프롬프트, 크기 및 길이를 조정한 후 생성합니다.

설명

이 워크플로우는 Open Pose를 사용하여 입력 영상에서 인간의 움직임을 추출하는 비디오에서 비디오로의 프롬프트 전이 워크플로우입니다. 따라서 매우 특수한 목적을 가지고 있습니다. 이 워크플로우는 AnimateDiff 3와 함께 작동합니다. 다양한 키프레임에 대해 다른 프롬프트를 선택하면, 영상 내에서 프롬프트가 서로 점진적으로 변환됩니다.

이 워크플로우에서 사용되는 AnimateDiff와 Stable Diffusion 1.5는 512픽셀 크기로 학습되었습니다. 따라서 생성 크기를 이보다 훨씬 높게 설정하는 것은 권장되지 않으며, 결과가 일관되지 않게 될 수 있습니다. 대신, 생성 후 업스케일링을 시도할 수 있습니다.

이 워크플로우에는 업스케일링 기능이 포함되어 있습니다. 그러나 저는 별도의 워크플로우에서 두 번째 Ksampler를 사용하여 업스케일링하는 것을 권장합니다. 자세한 내용은 다음 기사를 참조하세요:

https://www.tomgoodnoise.de/index.php/video-upscaling-in-comfyui/

시간

6초 길이, 해상도 640×480인 예제는 16GB VRAM을 가진 4060 TI에서 약 25분이 소요되었습니다. 비교적 긴 생성 시간은 체인 내 두 번째 Ksampler 때문이며, 이는 생략할 수 있습니다. 그러나 이는 품질을 약간 향상시킵니다. 더 높은 업스케일링은 생성 시간을 더욱 증가시킵니다. 따라서 이 워크플로우는 가장 빠른 방법은 아닙니다.

요구 사항

이 워크플로우는 과거 8GB VRAM으로 생성되었습니다. 그러나 저는 자주 OOM(메모리 부족) 오류에 직면했습니다. 최소 12GB VRAM을 가진 카드를 사용하는 것을 강력히 권장합니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.