Qwen 3 VL node for ComfyUI + Qwen 3 VL (Heretic, uncensored) model

详情

模型描述

实现 QWEN 3 VL 图像字幕生成(无审查)的极简自定义节点。

特点:

  • 每张图像处理时间:15-17 秒

  • 无需本地 LM Studio 或远程 VLM 服务

  • 由 ComfyUI 实现智能内存管理

  • 可指定系统提示词

  • 支持 'cuda'、'cuda:0'、'cuda:1'、'cpu' 设备(尚未完全测试)

  • 默认使用通过 "Heretic" 技术去审查(解禁)的 Qwen 3 VL 模型

操作说明:

若下载了完整的 6.58GB 压缩包,则需要将其解压分割。

文件夹 "Qwen3-VL-4B-Instruct-heretic-7refusal" 需放置于路径:"ComfyUI/models/prompt_generator/"。

压缩包 "ComfyUI-Qwen3VL.zip" 需解压至 "ComfyUI/custom_nodes" 目录。

完成上述操作后,重启 ComfyUI 后端及前端(浏览器)。

祝你好运!

欢迎提出评论!

此模型生成的图像

未找到图像。