Qwen3-4B-Thinking-2507 text encoder

詳細

ファイルをダウンロード

モデル説明

  • 完全に準備済みの Qwen3-4B-Thinking-2507 ビルド。バニラの Qwen3-4B と比較して、Z-Image モデル との連携でプロンプトの忠実度が著しく向上し、一般的な表現の誤解を回避します。推論および Z-Image LoRA 学習 に強く推奨されます。

  • パス: ComfyUI_windows_portable\ComfyUI\models\text_encoders\

  • Qwen3-4B-Thinking-2507 の使用方法:

    [ANCHOR: 誰/何が存在するか]
    [ROLE or STATE: それらを概念的に定義するもの]
    [ACTION or POSTURE: それらが何をしているか、またはどのように位置しているか]
    [RELATIONSHIP: それらが空間、オブジェクト、または視聴者とどのように関係しているか]
    [ENVIRONMENT: これが発生する場所(最低限)]
    [INTENT: 画像が伝えるべき意図]
    [LIGHTING: 意図をサポートするために選択された照明]
    [CAMERA / FRAMING: 視聴者がどのようにそれを認識するか]
    [STYLE RESTRAINTS: どのようなものに似せるか(ソフトに)]
    [CONSTRAINTS: 避けるべき要素]
    
    例:
    単独の成人男性、
    表現的ではなく、落ち着いて自己制御している、
    立ち姿勢でリラックスした姿勢、
    静かな緊張感を生むためにやや中心からずれて配置、
    簡素で散らかっていない室内空間、
    行動よりも存在感とキャラクターに焦点、
    柔らかな間接光で顔の特徴を自然に保つ、
    目線レベルのカメラ、胸上からのミディアムフレーミング、
    実写的だが控えめな写真スタイル、
    激しい感情、スタイル化、劇的な効果は避ける
    
    例2:
    [SUBJECT / ANCHOR],  
    [TRAIT / MOOD / PERSONALITY],  
    [ACTION / POSTURE / STATE],  
    [POSITION / RELATION TO SPACE / COMPOSITION],  
    [ENVIRONMENT / SETTING],  
    [INTENT / WHAT THE IMAGE SHOULD CONVEY],  
    [LIGHTING / ATMOSPHERE],  
    [CAMERA / FRAMING / PERSPECTIVE],  
    [STYLE / ARTISTIC DIRECTION],  
    [FORM CLARITY / SHAPE / TEXTURE / COLOR DIRECTIONS]
    
    例:
    単独の成人男性、  
    冷静で自己制御している、  
    立ち姿勢でリラックスした姿勢、  
    静かな緊張感を生むためにやや中心からずれて配置、  
    簡素で散らかっていない室内空間、  
    姿勢と表情を通じて存在感とキャラクターを示す、  
    柔らかな間接光で顔の特徴を自然に強調、  
    目線レベルのカメラ、胸上からのミディアムフレーミング、  
    淡いトーンと控えめな質感を持つ写真スタイル、  
    明確なフォルム、自然なプロポーション、読みやすいビジュアル構成を特徴とする
    
  • この例の部分のみをポジティブプロンプト内に使用してください; 説明部分は、テキストエンコーダーではなく、レイアウトを理解するためのものです

**Qwen3-4B-Thinking-2507 はこのモデルでは実験的なものですが、適切な調整を加えることで優れた出力が得られます。バニラの qwen3_4b で学習された LoRA は、このエンコーダーでは正しく動作しないため、このテキストエンコーダーを使用して再学習する必要があります。

  • 完全な学習スレッドは こちら でご確認ください。

  • Qwen3-4B-Thinking-2507 テキストエンコーダーを使用した AiToolKit の学習設定は こちら でご確認ください。

このモデルで生成された画像

画像が見つかりません。