Wan 2.2 simple Text to Image GGUF (txt2img) workflow

세부 정보

파일 다운로드

모델 설명

gguffers들, 안녕하세요. 네, 우리는 이미지 생성을 위해 비디오 모델을 사용할 것입니다. 다시 한 번 강조하지만, 이것은 텍스트에서 이미지로 변환하는 워크플로입니다. 왜냐하면 갑자기 WAN이 매우 멋진 사진과 같은 이미지를 생성할 수 있기 때문입니다. 또한 이 워크플로우는 다른 것들과 달리 매우 간단하고 최소한의 플러그인(수정된 노드)만 사용합니다. 이제 이 어이없는 GGUF들을 가져와서 작업을 시작해 봅시다.

필수 조건:

설치:

  • 모델 파일 다운로드:

    • 주 모델 - Wan2.2-T2V-A14B-LowNoise-Q6_K (ComfyUI\models\unet에 저장). 선택 사항: 16GB VRAM에는 Q6_K, 12GB VRAM에는 Q5_K_S를 선택하세요. Q8은 24GB에 적합합니다.
    • 텍스트 인코더 모델 - umt5-xxl-encoder-Q6_K (ComfyUI\models\text_encoders에 배치). 선택 사항: Q6_K 또는 다른 버전을 선택하세요.
    • VAE - Wan2.1_VAE (ComfyUI\models\vae에 넣으세요)
    • LoRA - Wan2.2-Lightning_T2V-v1.1-A14B-4steps-lora_LOW_fp16 (ComfyUI\models\lora로 이동). 주의: 정확한 모델을 다운로드하세요. 저노이즈와 고노이즈, T2V와 I2V를 혼동하지 마세요. 끝.
    • 이 워크플로우를 다운로드하고 ComfyUI에서 열기.
    • "Manager" → "Custom Nodes Manager"로 이동하여 "ComfyUI-GGUF" v1.1.3 이상 설치 (이전 버전은 "예상치 못한 텍스트 모델 아키텍처 유형" 오류를 발생시킬 수 있음). ComfyUI를 재시작하세요.

사용법:

  • 해상도 선택: 720p 또는 1080p(1088)가 적합합니다.

  • 스텝 수 및 샘플러 선택:

    • 1.01.3 cfg와 함께 1012스탭을 추천합니다. 더 높은 대비와 환각 제거를 위해 스텝을 20까지 늘릴 수 있습니다. 샘플러: euler, euler_cfg_pp, dpmpp_2m, dpmpp_sde, dpmpp_2m_sde, dpmpp_2s_a; 스케줄러: karras 또는 exponential.
    • LoRA를 사용하지 않는 경우, 약 3.5 cfg로 20~30스탭 이상 사용. euler simple, karras 등.

충돌 및 연결 끊김이 발생하면 더 낮은 양자화를 사용해 보세요.

GGUF 노드 설치 중 다른 오류가 발생하면 ComfyUI와 Manager를 완전히 재설치한 후 다시 시도하세요.

이 작업은 ComfyUI Windows 휴대용 버전 v0.3.49, 32GB RAM, 16GB VRAM 5060Ti에서 테스트되었습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.