BAGEL Workflow
세부 정보
파일 다운로드
모델 설명
참조 영상
🥯 ComfyUI용 BAGEL 워크플로우 – 모든 기능을 하나로 통합한 이미지 생성, 편집 및 시각적 추론
이것은 BAGEL(Blip-Aware Generator Enhanced with Logic)을 기반으로 구동되는 완전한 ComfyUI 워크플로우로, 텍스트-이미지 생성, 이미지 편집(인페인팅), 그리고 **BLIP2와 Vicuna를 활용한 시각적 질문 응답(VQA)**을 하나의 통합 파이프라인으로 결합합니다. 생성과 추론을 동시에 원하는 고급 AI 크리에이터에게 최적입니다.
🚀 주요 기능:
📷 언어 인식 기반의 텍스트-이미지 생성
🛠️ 정밀한 제어를 통한 이미지 편집 및 인페인팅
💬 BLIP2 + Vicuna 7B/13B를 활용한 시각적 질문 응답(VQA)
🔄 사전 빌드되고 최적화된 ComfyUI 워크플로우 — 수동 설정 불필요
🔧 VRAM 및 하드웨어 요구사항:
❗ 최소 VRAM: 16GB (BLIP2 및 Vicuna는 메모리 사용량이 큼)
💻 권장: 안정적인 성능을 위해 24GB 이상 (예: RTX 3090/4090 또는 A6000)
⚠️ 저VRAM 시스템에는 적합하지 않음 — Vicuna 모델은 크고 많은 리소스를 필요로 함
🧠 양자화된 모델을 사용하는 경우, exllama 또는 exllamav2 로더를 사용하면 성능이 더 향상될 수 있음


