Qwen Wan T2I 2K Upscale

세부 정보

파일 다운로드

모델 설명

이 워크플로우는 첫 단계에서 저해상도로 Qwen을 사용하여 Wan 2.2의 프롬프트 준수성을 확장합니다. 저해상도 출력에 뛰어난 디테일을 제공합니다.

하드웨어: RTX 3090 24GB

모델: Qwen Q4 GGUF + Wan 2.2 Low GGUF

종단 간 소요 시간 (2k 업스케일): 300초(초기 시작), 80-130초(0.5MP - 1MP)

핵심 요점 - Qwen 잠재 표현은 Wan 2.2 샘플러와 호환됩니다

두 단계로 구성됩니다:

1단계: (42s-77s). Qwen의 0.75/1.0/1.5MP 해상도에서 샘플링

2단계: (~110s): Wan 2.2 4단계

1단계는 매우 낮은 해상도까지 사용 가능합니다. 512x512는 아직 테스트하지 않았지만, 0.75MP는 작동합니다

* 텍스트 - 1.5배 업스케일 시 텍스트가 사라지며, 2.0배 업스케일 시 복원되는 것으로 보입니다. Comfy Qwen 블로그에서 가져온 프롬프트를 포함했습니다

* 풍경 (테스트하지 않음)

* 도시 풍경 (테스트하지 않음)

_실내 (테스트하지 않음)

* 초상화 - 클로즈업은 별로 좋지 않음(남성 노인 캐릭터가 더 나음). 풀바디, 미디엄 길이에서는 괜찮음. 재미있게도 특징을 부드럽게 하려면 0.75MP를 사용하세요. freckles(자반)에 집착합니다. 피하세요. 이 문제는 https://www.reddit.com/r/StableDiffusion/comments/1mjys5b/18_qwenimage_realism_lora_samples_first_attempt/에서 u/AI_Characters(https://www.reddit.com/user/AI_Characters/)가 제시한 18_QwenImage_Realism_LORA로 해결될 수 있을 것입니다

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.