Ovis-Image GGUF Text-to-Image Workflow by Sarcastic TOF
详情
下载文件
模型描述
这是一个非常简单、适合ComfyUI初学者的文本到图像工作流,可与运行在相对入门级GPU(NVIDIA/AMD显卡需8至12GB显存,Apple Silicon Mac搭载M系列处理器如M3、M4、M5等需16GB统一内存)上的单个Ovis-Image GGUF模型配合使用。Ovis-Image由阿里巴巴国际数字商业集团(AIDC-AI团队)于2025年11月下旬发布,是一款开源的70亿参数文本到图像生成模型。它能在英文或中文文本中,以多样化的字体、尺寸、布局和宽高比生成清晰、拼写正确且语义一致的文本。此外,Ovis-Image专门针对生成图像中的高质量文本渲染进行了优化,非常适合处理文字密集型提示,如海报、横幅、标志、UI原型、信息图、社交媒体图形和营销素材。该模型的文本渲染质量可媲美更大规模的模型(例如200亿参数级的Qwen-Image),并可与闭源系统如GPT-4o或Seedream相竞争。据我经验,它有时能生成类似Z-Image Turbo模型的AI图像,但在处理文字密集型提示时,其简单输出效果更佳。仅凭这一点,就绝对值得一试!
使用方法:
#1. 首先选择您所需的Ovis-Image GGUF模型,
#2. 然后选择图像输出尺寸,
#3. 接着输入正向提示和反向提示,
#4. 选择您希望生成的图像数量(更改“运行”按钮旁的数字),
#5. 设置采样方法、CFG值、步数等参数及其他可选设置,
#6. 最后点击“运行”按钮开始生成。完成!
尽情享受吧!
## 所需模型
======================
### Ovis-Image GGUF检查点下载链接 -
https://huggingface.co/convertor/ovis-image-gguf/resolve/main/ovis-image-iq4_nl.gguf
### Ovis-Image GGUF编码器下载链接 -
https://huggingface.co/convertor/ovis-image-gguf/resolve/main/qwen3_vl_2b_f32-iq4_nl.gguf
### Ovis-Image GGUF VAE下载链接(此为Flux GGUF VAE) -
https://huggingface.co/convertor/ovis-image-gguf/resolve/main/pig_flux_vae_fp32-f16.gguf





