BAGEL Workflow

详情

下载文件

模型描述

参考视频

🥯 BAGEL 工作流用于 ComfyUI — 一体化图像生成、编辑与视觉推理

这是一个由 BAGEL(基于逻辑增强的 BLIP 感知生成器)驱动的完整 ComfyUI 工作流,结合了 文本到图像生成图像编辑(局部重绘)视觉问答(VQA),使用 BLIP2 和 Vicuna 模型。适合希望在一个 streamlined 流程中实现生成与推理的高级 AI 创作者。


🚀 主要功能:

  • 📷 文本到图像生成,具备语言感知的细节控制

  • 🛠️ 图像编辑与局部重绘,实现精准操控

  • 💬 视觉问答(VQA) 通过 BLIP2 + Vicuna 7B/13B 实现

  • 🔄 预构建且优化的 ComfyUI 工作流 — 无需手动设置


🔧 显存与硬件要求:

  • 最低显存:16GB(BLIP2 + Vicuna 显存需求较高)

  • 💻 推荐配置:24GB 及以上(例如 RTX 3090/4090 或 A6000),以保证稳定性能

  • ⚠️ 不适合低显存系统 — Vicuna 模型体积庞大,需大量资源

  • 🧠 若使用量化模型,可选配 exllama 或 exllamav2 加载器以获得更优表现

此模型生成的图像

未找到图像。