BAGEL Workflow

詳細

ファイルをダウンロード

モデル説明

リファレンス動画

🥯 ComfyUI用 BAGELワークフロー — すべてを一つにまとめた画像生成・編集・視覚的推論

これはBAGEL(Blip-Aware Generator Enhanced with Logic)を搭載した完全なComfyUIワークフローで、テキストから画像への生成画像編集(インペインティング)、および**BLIP2とVicunaを用いた視覚的質問応答(VQA)**を統合しています。生成と推論を一つのスムーズなパイプラインで行いたい上級AIクリエイターに最適です。


🚀 主な特徴:

  • 📷 言語に配慮した詳細なテキストから画像への生成

  • 🛠️ 精密な制御が可能な画像編集およびインペインティング

  • 💬 BLIP2 + Vicuna 7B/13Bを用いた視覚的質問応答(VQA)

  • 🔄 事前構築・最適化済みのComfyUIワークフロー — 手動設定は不要


🔧 VRAMおよびハードウェア要件:

  • 最小VRAM: 16GB(BLIP2とVicunaはメモリ消費量が大きい)

  • 💻 推奨: 安定したパフォーマンスには24GB以上(例:RTX 3090/4090、A6000)

  • ⚠️ 低VRAMシステムには適していません — Vicunaモデルは大規模で大量のリソースを必要とします

  • 🧠 クオンタイズされたモデルを使用する場合、exllamaまたはexllamav2ローダーを使用するとさらに安定して動作します

このモデルで生成された画像

画像が見つかりません。