Ovis-Image GGUF Text-to-Image Workflow by Sarcastic TOF
세부 정보
파일 다운로드
모델 설명
이것은 상대적으로 초보적인 GPU(네이티브/AMD의 경우 8~12GB VRAM, M3, M4, M5 등 M 시리즈 프로세서를 탑재한 애플 실리콘 맥의 경우 16GB 기본 통합 메모리)에서 실행되는 단일 Ovis-Image GGUF 모델과 호환되는 매우 간단하고 ComfyUI 초보자 친화적인 텍스트-이미지 워크플로우입니다. Ovis-Image는 2025년 말에 공개된, 알리바바(AliExpress International Digital Commerce Group)의 AIDC-AI 팀이 개발한 오픈소스 70억 파라미터 텍스트-이미지 생성 모델입니다. 이 모델은 영어 또는 중국어 텍스트를 다양한 글꼴, 크기, 레이아웃 및 종횡비로 명확하고 철자 정확하며 의미적으로 일관된 텍스트를 생성합니다. 또한, Ovis-Image는 생성된 이미지 내에서 고품질 텍스트 렌더링을 위해 특별히 최적화되어 있어 포스터, 배너, 로고, UI 모ック업, 인포그래픽, 소셜 미디어 그래픽, 마케팅 자료 등 텍스트가 풍부한 프롬프트에 이상적입니다. 이 모델은 훨씬 더 큰 모델(예: Qwen-Image와 같은 20B+ 클래스)과 유사한 텍스트 렌더링 품질을 달성하며, GPT-4o 또는 Seedream과 같은 폐쇄형 시스템과도 경쟁력 있습니다. 제 경험상, 이 모델은 때때로 Z-Image Turbo 모델과 유사한 AI 사진을 생성할 수 있지만, 텍스트가 풍부한 프롬프트를 다루는 단순한 출력에서 더 나은 성능을 발휘합니다. 단지 이 이유 하나만으로도 시도해볼 만한 가치가 충분합니다!
사용 방법:
#1. 먼저 원하는 Ovis-Image GGUF 모델을 선택하세요.
#2. 그다음 이미지 출력 크기를 설정하세요.
#3. 긍정적 및 부정적 프롬프트를 입력하세요.
#4. 생성할 이미지 개수를 선택하세요(“Run” 버튼 옆의 숫자를 변경하세요).
#5. 샘플링 방법, CFG, 스텝 등 기타 설정을 조정하세요.
#6. 마지막으로 Run 버튼을 눌러 생성하세요. 끝입니다.
즐겁게 사용하세요!
## 필요 모델
======================
### Ovis-Image GGUF 체크포인트 다운로드 링크 -
https://huggingface.co/convertor/ovis-image-gguf/resolve/main/ovis-image-iq4_nl.gguf
### Ovis-Image GGUF 인코더 다운로드 링크 -
https://huggingface.co/convertor/ovis-image-gguf/resolve/main/qwen3_vl_2b_f32-iq4_nl.gguf
### Ovis-Image GGUF VAE 다운로드 링크 (이것은 단순히 Flux GGUF VAE입니다) -
https://huggingface.co/convertor/ovis-image-gguf/resolve/main/pig_flux_vae_fp32-f16.gguf





