Qwen 3 VL node for ComfyUI + Qwen 3 VL (Heretic, uncensored) model

詳細

ファイルをダウンロード

モデル説明

QWEN 3 VLの画像キャプション生成(検閲解除済み)を実装したミニマリストなカスタムノード。

主な特徴:

  • 1枚の画像あたり15〜17秒

  • ローカルのLM StudioやリモートのVLMサービスは不要

  • ComfyUIによるスマートなメモリ管理

  • システムプロンプトを指定可能

  • 'cuda', 'cuda:0', 'cuda:1', 'cpu'デバイスをサポート(まだ完全にはテストされていません)

  • デフォルトでは、「Heretic」テクノロジーを使用して検閲解除されたQwen 3 VLモデルを使用します。

設定手順:

6.58GBのアーカイブをダウンロードした場合、それを分割する必要があります。

フォルダ「Qwen3-VL-4B-Instruct-heretic-7refusal」は、パス「ComfyUI/models/prompt_generator/」に配置してください。

アーカイブ「ComfyUI-Qwen3VL.zip」は「ComfyUI/custom_nodes」に解凍してください。

上記の操作後、ComfyUIのバックエンドとフロントエンド(ブラウザ)を再起動してください。

good luck!

コメントをお待ちしています。

このモデルで生成された画像

画像が見つかりません。