More faithful prompt adherence for FLUX.2 Klein 9B

詳細

ファイルをダウンロード

モデル説明

2026年1月20日 更新

オープンソースは誠実さと透明性を重視するものであるため、初期リリースに修正が必要なエラーがあることに気づきました。一部の機能は動作していましたが、内部にあった平均値再中心化ステップのせいで、コードが自らの作業を一部取り消していたのです。

発生していた状況:

Enhancement: scale=1.250, mag 893.77 -> 1117.21   ← 適用済み
Output change: mean=0.000000                      ← しかし最終出力は変化なし

エンハンスメントは内部では動作していましたが、サンプラーに渡される最終テンソルは入力とほぼ同一でした。以前に結果を得られたのは、この問題を回避していたedit_text_weightによるものでした。

変更点:

新旧

text_enhance

magnitude

detail_sharpen

contrast

coherence_experimental

削除(不安定だった)

edit_blend_mode

削除

active_token_end: 77 ハードコーディング

アテンションマスクから自動検出

テキスト→画像用の新しいプリセット:

              BASE   GENTLE   MOD   STRONG   AGG     MAX
              ----    ----    ----    ----    ----    ----
magnitude:    1.20    1.15    1.25    1.35    1.50    1.75
contrast:     0.00    0.10    0.20    0.30    0.40    0.60
normalize:    0.00    0.00    0.00    0.15    0.25    0.35
edit_weight:  1.00    1.00    1.00    1.00    1.00    1.00

画像編集用の新しいプリセット:

              PRESERVE   SUBTLE   BALANCED   FOLLOW   FORCE
              --------   ------   --------   ------   -----
magnitude:       0.85     1.00       1.10     1.20    1.35
contrast:        0.00     0.05       0.10     0.15    0.25
normalize:       0.00     0.00       0.10     0.10    0.15
edit_weight:     0.70     0.85       1.00     1.25    1.50

現在実際に動作しているかを確認する方法:

debug: true を設定してください。0でない出力変化が表示されるはずです:

Output change: mean=42.53, max=1506.23

meanが0の場合は何らかの問題があります。

リポジトリから最新版を取得してください。パラメータ名が変更されたため、古いワークフローは動作しなくなります。

4Bモデルについては、まず9Bモデルを完全に理解してから取り組みたいと考えています。異なるアーキテクチャには異なる対応が必要であり、また修正が必要なリリースを急いで出すより、正しく行うほうが重要です。

以前と同様のアドバイス:望む結果が得られない場合、すぐにパラメータを変更しないでください。まずプロンプトを再読みしてください。パラメータを変更する必要がある場合は、シードを固定し、段階的に調整してください。

また、領域強調用の2番目のノード「Detail Controller」を調整しました:

- front_mult: トークンの最初の25%(通常は主語)

- mid_mult: 中央の50%(通常は詳細)

- end_mult: 最後の25%(通常はスタイル用語)

細かい制御用のオプショナルノードです。メインのエンハンサーでほとんどのケースをカバーできます。

元の投稿:こちら

リポジトリ:https://github.com/capitan01R/ComfyUI-Flux2Klein-Enhancer


ComfyUI用のカスタムノードをリリースしました。このノードはFLUX.2 Kleinの条件付けを修正し、特に画像編集モードでのプロンプトの忠実な実行を向上させます。

見つけた点:

FLUX.2 Kleinは形状が[1, 512, 12288]の条件付けテンソルを出力します。位置0-77には高分散(標準偏差40)の実際のテキスト埋め込みが含まれ、位置77-511は低分散(標準偏差2)のパディングです。

このノードはアクティブな領域(0-77)のみを変更し、メタデータにreference_latentsが存在するかをチェックすることで画像編集モードを自動検出します。

画像編集で私が最も効果的だと感じた設定:

text_enhance: 1.50

edit_text_weight: 2.00

その他はデフォルト値

テキスト→画像では、detail_sharpenパラメータが複雑なプロンプト内の概念の分離に役立ちますが、画像編集では主にtext_enhanceとedit_text_weightが必要です。

GitHub:https://github.com/capitan01R/ComfyUI-Flux2Klein-Enhancer

マネージャー経由でインストール:ComfyUI-Flux2Klein-Enhancer

問題や提案があればお知らせください。デバッグトグルはテンソル統計を出力するため、条件付けが実際に変更されているか、単に通過しているだけかを確認できます。

このモデルで生成された画像

画像が見つかりません。