BAGEL Workflow
詳細
ファイルをダウンロード
モデル説明
リファレンス動画
🥯 ComfyUI用 BAGELワークフロー — すべてを一つにまとめた画像生成・編集・視覚的推論
これはBAGEL(Blip-Aware Generator Enhanced with Logic)を搭載した完全なComfyUIワークフローで、テキストから画像への生成、画像編集(インペインティング)、および**BLIP2とVicunaを用いた視覚的質問応答(VQA)**を統合しています。生成と推論を一つのスムーズなパイプラインで行いたい上級AIクリエイターに最適です。
🚀 主な特徴:
📷 言語に配慮した詳細なテキストから画像への生成
🛠️ 精密な制御が可能な画像編集およびインペインティング
💬 BLIP2 + Vicuna 7B/13Bを用いた視覚的質問応答(VQA)
🔄 事前構築・最適化済みのComfyUIワークフロー — 手動設定は不要
🔧 VRAMおよびハードウェア要件:
❗ 最小VRAM: 16GB(BLIP2とVicunaはメモリ消費量が大きい)
💻 推奨: 安定したパフォーマンスには24GB以上(例:RTX 3090/4090、A6000)
⚠️ 低VRAMシステムには適していません — Vicunaモデルは大規模で大量のリソースを必要とします
🧠 クオンタイズされたモデルを使用する場合、exllamaまたはexllamav2ローダーを使用するとさらに安定して動作します


