Z-Image Turbo FP8 [Kijai]

세부 정보

파일 다운로드

모델 설명

텍스트 인코더 | VAE

이미 SDXL, Flux 또는 Qwen 기반 생성기를 사용 중이라면, Z-Image-Turbo의 간단한 설명은 다음과 같습니다:

Alibaba에서 개발한 초고속 텍스트-이미지 모델로, 고성능 단일 GPU(3090/4090에서는 몇 초 내)에서 1024×1024 해상도의 이미지를 1초 내에 생성합니다. 이 속도는 강력한 지식 증류 기술을 통해 달성되었으며, 훨씬 더 큰 내부 모델들에 의해 학습된 약 6B 규모의 모델입니다. 따라서 이 모델은 대부분의 오픈소스 모델보다 폐쇄형 최상위 모델에 더 가깝습니다.

기존 모델들과 비교하면:

  • Flux 및 SDXL보다 빠릅니다(SD3.5 Turbo는 제 테스트에서 약간 더 빠릅니다.)

  • 현재의 대부분의 오픈소스 모델보다 프롬프트 준수 능력이 뛰어나고 결과가 더 아름답습니다.

  • 이미지 내 영어 및 중국어 텍스트를 거의 완벽하게 렌더링합니다.

  • 현재 공개 인간 투표 랭킹(AI Arena Elo)에서 1위를 차지하고 있습니다.

Tongyi-MAI HF | GitHub

편의를 위해 여기에 모델이 복제되었습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.