Qwen3-4B-Thinking-2507 text encoder

完全に準備済みの Qwen3-4B-Thinking-2507 ビルド。バニラの Qwen3-4B と比較して、Z-Image モデル との連携でプロンプトの忠実度が著しく向上し、一般的な表現の誤解を回避します。推論および Z-Image LoRA 学習 に強く推奨されます。
パス: ComfyUI_windows_portable\ComfyUI\models\text_encoders\

Qwen3-4B-Thinking-2507 の使用方法:

[ANCHOR: 誰／何が存在するか]
[ROLE or STATE: それらを概念的に定義するもの]
[ACTION or POSTURE: それらが何をしているか、またはどのように位置しているか]
[RELATIONSHIP: それらが空間、オブジェクト、または視聴者とどのように関係しているか]
[ENVIRONMENT: これが発生する場所（最低限）]
[INTENT: 画像が伝えるべき意図]
[LIGHTING: 意図をサポートするために選択された照明]
[CAMERA / FRAMING: 視聴者がどのようにそれを認識するか]
[STYLE RESTRAINTS: どのようなものに似せるか（ソフトに）]
[CONSTRAINTS: 避けるべき要素]

例:
単独の成人男性、
表現的ではなく、落ち着いて自己制御している、
立ち姿勢でリラックスした姿勢、
静かな緊張感を生むためにやや中心からずれて配置、
簡素で散らかっていない室内空間、
行動よりも存在感とキャラクターに焦点、
柔らかな間接光で顔の特徴を自然に保つ、
目線レベルのカメラ、胸上からのミディアムフレーミング、
実写的だが控えめな写真スタイル、
激しい感情、スタイル化、劇的な効果は避ける

例2:
[SUBJECT / ANCHOR],  
[TRAIT / MOOD / PERSONALITY],  
[ACTION / POSTURE / STATE],  
[POSITION / RELATION TO SPACE / COMPOSITION],  
[ENVIRONMENT / SETTING],  
[INTENT / WHAT THE IMAGE SHOULD CONVEY],  
[LIGHTING / ATMOSPHERE],  
[CAMERA / FRAMING / PERSPECTIVE],  
[STYLE / ARTISTIC DIRECTION],  
[FORM CLARITY / SHAPE / TEXTURE / COLOR DIRECTIONS]

例:
単独の成人男性、  
冷静で自己制御している、  
立ち姿勢でリラックスした姿勢、  
静かな緊張感を生むためにやや中心からずれて配置、  
簡素で散らかっていない室内空間、  
姿勢と表情を通じて存在感とキャラクターを示す、  
柔らかな間接光で顔の特徴を自然に強調、  
目線レベルのカメラ、胸上からのミディアムフレーミング、  
淡いトーンと控えめな質感を持つ写真スタイル、  
明確なフォルム、自然なプロポーション、読みやすいビジュアル構成を特徴とする

この例の部分のみをポジティブプロンプト内に使用してください； 説明部分は、テキストエンコーダーではなく、レイアウトを理解するためのものです

**Qwen3-4B-Thinking-2507 はこのモデルでは実験的なものですが、適切な調整を加えることで優れた出力が得られます。バニラの qwen3_4b で学習された LoRA は、このエンコーダーでは正しく動作しないため、このテキストエンコーダーを使用して再学習する必要があります。

完全な学習スレッドはこちらでご確認ください。
Qwen3-4B-Thinking-2507 テキストエンコーダーを使用した AiToolKit の学習設定はこちらでご確認ください。

モデルタイプ	チェックポイント
ベースモデル	Qwen
公開日	1/2/2026

Qwen3-4B-Thinking-2507 text encoder

詳細

ファイルをダウンロード

このバージョンについて

モデル説明

このモデルで生成された画像