Z-Image Turbo - Quantized for low VRAM
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
Z-Image Turbo는 알리바바 그룹의 통의 실험실(Tongyi Lab) 팀이 개발한 Lumina 아키텍처 기반의 6B 이미지 모델인 Z-Image의 디스틸된 버전입니다. 출처: https://huggingface.co/Tongyi-MAI/Z-Image-Turbo
여기에는 bf16에서 fp8_e4m3fn으로 양자화된 버전을 업로드했습니다. 이는 가중치의 정밀도(및 결과적으로 크기)를 절반으로 줄여 상당한 성능 향상을 이루면서도 대부분의 품질을 유지한 것입니다. 추론 시간은 일반적인 '비디스틸된' SDXL과 유사하지만, 프롬프트 준수도와 해상도/디테일이 더 우수합니다. 성능이 낮은 PC에 적합합니다.
특징
가벼움: Turbo 버전은 낮은 스텝(5-9)으로 학습되었으며,
fp8_e4m3fn양자화 크기는 약 6GB로, 저사양 GPU에서도 사용 가능합니다.검열 없음: 다른 모델들(
)이 검열하는 많은 개념들이 즉시 사용 가능합니다. 우수한 프롬프트 준수: 강력한 텍스트 인코더 Qwen 3 4B 덕분에 Flux.1 Dev와 유사한 수준입니다.
텍스트 렌더링: Flux.1 Dev와 유사하며, 일부는 2배 작음에도 더 나은 성능이라고 평가합니다.
스타일 유연성: 사진과 같은 사실적인 이미지부터 애니메이션, 회화, 픽셀 아트, 로우 폴리, 만화, 일러스트레이션 등 다양한 스타일을 생성할 수 있습니다.
고해상도: 기본적으로 최대 2MP 해상도를 생성할 수 있습니다(업스케일링 전!).
의존성
text_encoders디렉토리에 Qwen 3 4B 다운로드: https://huggingface.co/Comfy-Org/z_image_turbo/blob/main/split_files/text_encoders/qwen_3_4b.safetensorsvae디렉토리에 Flux VAE 다운로드: https://huggingface.co/Comfy-Org/z_image_turbo/blob/main/split_files/vae/ae.safetensors
사용법
워크플로우 및 메타데이터는 샘플 이미지에서 확인할 수 있습니다.
스텝: 5 - 15.
CFG: 1.0. 이 값은 부정적 프롬프트를 무시하므로 사용할 필요가 없습니다.
샘플러/스케줄러:
기본 이미지에 가장 추천 조합:
euler+beta또는bong_tangent(RES4LYF에서 제공) — 빠르고, 낮은 스텝(5)에서도 우수한 결과를 제공합니다.대부분의 다단계 샘플러(예:
res_2s,res_2m,dpmpp_2m_sde등)는 훌륭하지만, 동일한 스텝에서 40% 느려질 수 있습니다. 이 경우sgm_uniform같은 스케줄러가 필요할 수 있습니다.거의 모든 샘플러가 잘 작동합니다:
sa_solver,seeds_2,er_sde,gradient_estimation.나쁜 결과나 성능 저하로 인해 피해야 할 것들:
dpm_adaptive샘플러karras스케줄러
일부 샘플러와 스케줄러는 과도한 텍스처를 추가할 수 있으므로, shift 값을 증가시켜 조정할 수 있습니다(예: ComfyUI의
ModelSamplingAuraFlow노드에서 shift를 7로 설정).
해상도: 기본적으로 최대 2MP까지 생성 가능. 불확실할 경우 SDXL, Flux.1, Qwen Image 등과 동일한 해상도를 사용하세요(512px까지도 SD 1.5 수준으로 작동). 예시:
896x1152
1024x1024
1216x832
1440x1440
1024x1536
업스케일 및/또는 디테일러는 눈, 이빨, 머리카락 같은 작은 디테일을 보정하는 데 권장됩니다.
참고: 업스케일 샘플러에서 Z-Image 모델을 사용할 경우 과도한 텍스처와 노이즈가 발생할 수 있습니다. 몇 가지 해결 방법:
euler+simple과 함께 shift를 7로 설정하세요(일부 샘플러/스케줄러는 자체 shift를 가지고 있어 도움이 되지 않을 수 있음).Z-Image는 Superscale, Remacri, Siax, UltraSharp 등 업스케일 모델이 생성하는 아티팩트에 매우 민감하므로, 이 모델들을 피하세요.
다른 디스틸된 모델들과 달리, Z-Image는 업스케일 샘플러에서 최소 5스텝 이상을 요구하여 이미지 선명도를 유지합니다.
denoise 값이 0.5에 가까울수록 결과가 더 선명해집니다. 저는 0.4~0.63 사이를 선호합니다.
프롬프트: 자연어, 콤마로 구분된 키워드/태그, JSON 등 어떤 형식도 잘 작동합니다. 더 정확한 결과를 위해 영어로 작성하세요.
자주 묻는 질문
이 모델은 검열이 없나요?
- 네, 다만 원하는 특정 개념에 대해 잘 학습되지 않았을 수 있습니다. 직접 시도해 보세요.
업스케일 후 왜 텍스처가 너무 많이 생기나요?
- 위의 업스케일 사용법을 참조하세요.
내 PC에서 실행할 수 있나요?
SDXL을 실행할 수 있다면, Z-Image Turbo fp8도 실행 가능할 확률이 높습니다. 그렇지 않으면 RAM을 늘리세요.
모든 이미지는 32GB RAM, RTX3080 Mobile 8GB VRAM을 탑재한 노트북에서 생성했습니다.
라이선스는 자유롭나요?
- Apache 2.0 라이선스로, 매우 자유롭습니다.





