Z-Image Turbo - Quantized for low VRAM

세부 정보

파일 다운로드

모델 설명

Z-Image Turbo는 알리바바 그룹의 통의 실험실(Tongyi Lab) 팀이 개발한 Lumina 아키텍처 기반의 6B 이미지 모델인 Z-Image의 디스틸된 버전입니다. 출처: https://huggingface.co/Tongyi-MAI/Z-Image-Turbo

여기에는 bf16에서 fp8_e4m3fn으로 양자화된 버전을 업로드했습니다. 이는 가중치의 정밀도(및 결과적으로 크기)를 절반으로 줄여 상당한 성능 향상을 이루면서도 대부분의 품질을 유지한 것입니다. 추론 시간은 일반적인 '비디스틸된' SDXL과 유사하지만, 프롬프트 준수도와 해상도/디테일이 더 우수합니다. 성능이 낮은 PC에 적합합니다.

특징

  • 가벼움: Turbo 버전은 낮은 스텝(5-9)으로 학습되었으며, fp8_e4m3fn 양자화 크기는 약 6GB로, 저사양 GPU에서도 사용 가능합니다.

  • 검열 없음: 다른 모델들()이 검열하는 많은 개념들이 즉시 사용 가능합니다.

  • 우수한 프롬프트 준수: 강력한 텍스트 인코더 Qwen 3 4B 덕분에 Flux.1 Dev와 유사한 수준입니다.

  • 텍스트 렌더링: Flux.1 Dev와 유사하며, 일부는 2배 작음에도 더 나은 성능이라고 평가합니다.

  • 스타일 유연성: 사진과 같은 사실적인 이미지부터 애니메이션, 회화, 픽셀 아트, 로우 폴리, 만화, 일러스트레이션 등 다양한 스타일을 생성할 수 있습니다.

  • 고해상도: 기본적으로 최대 2MP 해상도를 생성할 수 있습니다(업스케일링 전!).

의존성

사용법

워크플로우 및 메타데이터는 샘플 이미지에서 확인할 수 있습니다.

  • 스텝: 5 - 15.

  • CFG: 1.0. 이 값은 부정적 프롬프트를 무시하므로 사용할 필요가 없습니다.

  • 샘플러/스케줄러:

    • 기본 이미지에 가장 추천 조합: euler + beta 또는 bong_tangent (RES4LYF에서 제공) — 빠르고, 낮은 스텝(5)에서도 우수한 결과를 제공합니다.

    • 대부분의 다단계 샘플러(예: res_2s, res_2m, dpmpp_2m_sde 등)는 훌륭하지만, 동일한 스텝에서 40% 느려질 수 있습니다. 이 경우 sgm_uniform 같은 스케줄러가 필요할 수 있습니다.

    • 거의 모든 샘플러가 잘 작동합니다: sa_solver, seeds_2, er_sde, gradient_estimation.

    • 나쁜 결과나 성능 저하로 인해 피해야 할 것들:

      • dpm_adaptive 샘플러

      • karras 스케줄러

    • 일부 샘플러와 스케줄러는 과도한 텍스처를 추가할 수 있으므로, shift 값을 증가시켜 조정할 수 있습니다(예: ComfyUI의 ModelSamplingAuraFlow 노드에서 shift를 7로 설정).

  • 해상도: 기본적으로 최대 2MP까지 생성 가능. 불확실할 경우 SDXL, Flux.1, Qwen Image 등과 동일한 해상도를 사용하세요(512px까지도 SD 1.5 수준으로 작동). 예시:

    • 896x1152

    • 1024x1024

    • 1216x832

    • 1440x1440

    • 1024x1536

  • 업스케일 및/또는 디테일러는 눈, 이빨, 머리카락 같은 작은 디테일을 보정하는 데 권장됩니다.

    • 참고: 업스케일 샘플러에서 Z-Image 모델을 사용할 경우 과도한 텍스처와 노이즈가 발생할 수 있습니다. 몇 가지 해결 방법:

      • euler + simple과 함께 shift를 7로 설정하세요(일부 샘플러/스케줄러는 자체 shift를 가지고 있어 도움이 되지 않을 수 있음).

      • Z-Image는 Superscale, Remacri, Siax, UltraSharp 등 업스케일 모델이 생성하는 아티팩트에 매우 민감하므로, 이 모델들을 피하세요.

      • 다른 디스틸된 모델들과 달리, Z-Image는 업스케일 샘플러에서 최소 5스텝 이상을 요구하여 이미지 선명도를 유지합니다.

      • denoise 값이 0.5에 가까울수록 결과가 더 선명해집니다. 저는 0.4~0.63 사이를 선호합니다.

  • 프롬프트: 자연어, 콤마로 구분된 키워드/태그, JSON 등 어떤 형식도 잘 작동합니다. 더 정확한 결과를 위해 영어로 작성하세요.

자주 묻는 질문

  • 이 모델은 검열이 없나요?

    • 네, 다만 원하는 특정 개념에 대해 잘 학습되지 않았을 수 있습니다. 직접 시도해 보세요.
  • 업스케일 후 왜 텍스처가 너무 많이 생기나요?

    • 위의 업스케일 사용법을 참조하세요.
  • 내 PC에서 실행할 수 있나요?

    • SDXL을 실행할 수 있다면, Z-Image Turbo fp8도 실행 가능할 확률이 높습니다. 그렇지 않으면 RAM을 늘리세요.

    • 모든 이미지는 32GB RAM, RTX3080 Mobile 8GB VRAM을 탑재한 노트북에서 생성했습니다.

  • 라이선스는 자유롭나요?

    • Apache 2.0 라이선스로, 매우 자유롭습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.