More faithful prompt adherence for FLUX.2 Klein 9B

세부 정보

파일 다운로드

모델 설명

2026년 1월 20일 업데이트

오픈 소스는 정직성과 투명성을 기반으로 하기 때문에, 제가 처음 릴리스한 버전에 수정해야 할 오류가 있다는 것을 발견했습니다. 이 코드는 일부 작동했지만, 제가 포함한 평균 재중심화 단계 때문에 코드가 스스로의 작업을 일부 되돌리는 문제가 있었습니다.

발생했던 상황:

향상: scale=1.250, mag 893.77 -> 1117.21   ← 적용됨
출력 변경: mean=0.000000                      ← 그러나 최종 출력은 변경되지 않음

향상 기능은 내부적으로 실행되었지만, 샘플러로 전달되는 최종 텐서는 입력과 거의 동일했습니다. 이전에 결과를 얻었다면, 이 문제를 우회한 edit_text_weight 덕분이 대부분이었습니다.

변경된 사항:

새로운 이전
text_enhance
magnitude
detail_sharpen
contrast
coherence_experimental
(제거됨: 불안정함)
edit_blend_mode (제거됨)
active_token_end: 77 하드코딩 자동 감지 (어텐션 마스크 기반)

텍스트-이미지용 새 프리셋:

              BASE   GENTLE   MOD   STRONG   AGG     MAX
              ----    ----    ----    ----    ----    ----
magnitude:    1.20    1.15    1.25    1.35    1.50    1.75
contrast:     0.00    0.10    0.20    0.30    0.40    0.60
normalize:    0.00    0.00    0.00    0.15    0.25    0.35
edit_weight:  1.00    1.00    1.00    1.00    1.00    1.00

이미지 편집용 새 프리셋:

              PRESERVE   SUBTLE   BALANCED   FOLLOW   FORCE
              --------   ------   --------   ------   -----
magnitude:       0.85     1.00       1.10     1.20    1.35
contrast:        0.00     0.05       0.10     0.15    0.25
normalize:       0.00     0.00       0.10     0.10    0.15
edit_weight:     0.70     0.85       1.00     1.25    1.50

이제 실제로 작동하는지 확인하는 방법:

debug: true로 설정하세요. 0이 아닌 출력 변경이 표시되어야 합니다:

Output change: mean=42.53, max=1506.23

mean이 0이라면 뭔가 잘못되었습니다.

최신 버전을 저장소에서 풀어주세요. 이전 워크플로우는 파라미터 이름 변경으로 인해 작동하지 않습니다.

4B 모델에 대해서는, 9B 모델을 완전히 이해한 후에 진행하려고 합니다. 다른 아키텍처는 다른 처리 방식이 필요하며, 다시 수정해야 하는 릴리스를 서두르기보다는 제대로 하는 것이 낫습니다.

이전과 같은 팁: 원하는 결과를 얻지 못했다면 즉시 파라미터를 변경하지 마세요. 먼저 프롬프트를 다시 읽어보세요. 파라미터를 변경해야 한다면 시드를 고정하고 점진적으로 조정하세요.

또한 지역적 강조를 위한 두 번째 노드인 Detail Controller도 조정했습니다:

- front_mult: 토큰의 처음 25% (보통 주체)

- mid_mult: 중간 50% (보통 세부 사항)

- end_mult: 마지막 25% (보통 스타일 관련 용어)

정밀 제어용 옵션 노드. 주요 향상기능은 대부분의 경우를 커버합니다.

원본 게시물: 여기

저장소: https://github.com/capitan01R/ComfyUI-Flux2Klein-Enhancer


ComfyUI용 맞춤 노드를 출시했습니다. 이 노드는 FLUX.2 Klein의 조건부 텐서를 수정하여 프롬프트 준수도와 정확도를 향상시키며, 특히 이미지 편집 모드에서 효과적입니다.

제가 발견한 내용:

FLUX.2 Klein은 [1, 512, 12288] 형태의 조건부 텐서를 출력합니다. 0-77번 위치에는 높은 분산(표준편차 ~40)을 가진 실제 텍스트 임베딩이 포함되어 있고, 77-511번 위치는 낮은 분산(표준편차 ~2)의 패딩입니다.

이 노드는 활성 영역(0-77)만 수정하며, 메타데이터에 reference_latents가 존재하는지 확인하여 이미지 편집 모드를 자동으로 감지합니다.

제가 이미지 편집에서 가장 효과적이었다고 느낀 설정:

text_enhance: 1.50

edit_text_weight: 2.00

나머지는 기본값

텍스트-이미지 생성에는 detail_sharpen 파라미터가 복잡한 프롬프트에서 개념을 분리하는 데 도움이 되지만, 이미지 편집에서는 주로 text_enhance와 edit_text_weight가 필요합니다.

GitHub: https://github.com/capitan01R/ComfyUI-Flux2Klein-Enhancer

매니저를 통해 설치: ComfyUI-Flux2Klein-Enhancer

문제가 발생하거나 제안사항이 있다면 알려주세요. debug 옵션을 켜면 텐서 통계가 출력되어 조건부 텐서가 실제로 변경되는지, 단순히 통과만 하는지 확인할 수 있습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.