Consistent character poses workflow

세부 정보

파일 다운로드

모델 설명

마침내 일관된 캐릭터 포즈를 위한 해결책이 등장했습니다!

원하는 모든 캐릭터원하는 포즈를 입력하기만 하면 끝입니다.

제가 제시한 예시는 선택적으로 골라낸 것이 아닙니다. 약 30번 이상 테스트해보았으며, 모두 제가 요청한 대로 정확히 생성되었습니다.

ControlNet 지원을 갖춘 이미지-이미지 모델이 WAN 2.1에서 출시될 때까지, 현재 제 워크플로우는 일관된 캐릭터 포즈를 Achieve하기 위한 최고의 대안입니다.

Flux Kontext보다 더 나으며 훨씬 빠릅니다.

16GB VRAM을 가진 A4000 GPU에서, 3장의 이미지를 생성하는 데 약 40~50초가 소요됩니다.

제 워크플로우에서 사용하는 가장 빠른 WAN2.1 모델 링크: https://huggingface.co/QuantStack/Wan2.1_T2V_14B_LightX2V_StepCfgDistill_VACE-GGUF/tree/main

주의사항 1: 저는 매우 최적화된 Wan2.1 vace 모델을 사용하고 있으며, 생성 설정을 보면 단지 4스탭과 1 CFG만 사용하고 있습니다. 자신의 Wan2.1 vace 모델을 사용하려면, 모델에 가장 적합한 설정으로 이 값을 증가시키세요. 하지만 저는 제가 링크한 모델을 다운로드하는 것을 강력히 추천합니다. 매우 빠릅니다!

Wan 2.1 vae: https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/tree/main/split_files/vae

주의사항 2: triton/torch/cuda 오류가 발생하면, torchcompileModelwanVideoV2 노드를 건너뛰고, Comfy Manager에서 "모두 업데이트"를 실행한 후 재시작하세요.

제가 사용하는 CLIP 모델: https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors

사용한 포즈: /model/22214/openposes-collection (물론 본인의 포즈를 사용하셔도 됩니다)

이제 하나의 참조 이미지만으로 캐릭터용 LoRA를 생성할 수 있습니다.
또는 이 워크플로우가 있다면, 왜 굳이 LoRA를 만들 필요가 있을까요?

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.