Qwen3-4B-Thinking-2507 text encoder

详情

下载文件

模型描述

  • 一个完全就绪的 Qwen3-4B-Thinking-2507 版本。与原始的 Qwen3-4B 相比,它在与 Z-Image 模型 配合时表现出更优的提示遵循能力,并能避免常见的措辞误解。强烈推荐用于推理和 Z-Image LoRA 训练

  • 路径:ComfyUI_windows_portable\ComfyUI\models\text_encoders\

  • Qwen3-4B-Thinking-2507 使用方法:

    [物理 + 材质 + 光照 + 姿势 + 构图约束] 
    - 此行通过定义图像必须遵守的物理和视觉规则,强制内部推理。
    - 请勿在此处描述场景,仅使用评估性约束。
    [主体 + 行为 + 环境 + 关键视觉属性] 
    - 此行描述图像中实际存在的内容。
    - 要具体、直白,这才是会被渲染的部分。
    示例: 
    真实的人体解剖结构,物理准确的服装纹理,柔和的自然阳光,随意站立姿势,平衡的公园构图
    
    一名戴太阳镜的男子正在城市公园慢跑,身穿灰色连帽衫和黑色运动裤,晨光透过树木洒落,铺砌的小径两侧绿意盎然
    
  • 你将上述示例部分直接用于你的正向提示中; 解释部分仅用于帮助你理解格式,不属于文本编码器的输入

**请注意,Qwen3-4B-Thinking-2507 在此模型中仅为实验性版本,但经过适当调整后可产生优异输出。任何在原始 qwen3_4b 上训练的 LoRA 在此编码器下均无法正常工作,因此你需要使用此文本编码器重新训练。

  • 完整训练流程详见:此处

  • 使用 Qwen3-4B-Thinking-2507 文本编码器的 AiToolKit 训练配置请见:此处

此模型生成的图像

未找到图像。