BAGEL Workflow
详情
下载文件
模型描述
参考视频
🥯 BAGEL 工作流用于 ComfyUI — 一体化图像生成、编辑与视觉推理
这是一个由 BAGEL(基于逻辑增强的 BLIP 感知生成器)驱动的完整 ComfyUI 工作流,结合了 文本到图像生成、图像编辑(局部重绘) 和 视觉问答(VQA),使用 BLIP2 和 Vicuna 模型。适合希望在一个 streamlined 流程中实现生成与推理的高级 AI 创作者。
🚀 主要功能:
📷 文本到图像生成,具备语言感知的细节控制
🛠️ 图像编辑与局部重绘,实现精准操控
💬 视觉问答(VQA) 通过 BLIP2 + Vicuna 7B/13B 实现
🔄 预构建且优化的 ComfyUI 工作流 — 无需手动设置
🔧 显存与硬件要求:
❗ 最低显存:16GB(BLIP2 + Vicuna 显存需求较高)
💻 推荐配置:24GB 及以上(例如 RTX 3090/4090 或 A6000),以保证稳定性能
⚠️ 不适合低显存系统 — Vicuna 模型体积庞大,需大量资源
🧠 若使用量化模型,可选配 exllama 或 exllamav2 加载器以获得更优表现


