FLUX.2 [klein] AIO

세부 정보

모델 설명

🚀 FLUX.2 [klein] 4B AIO | 초단속 이미지 생성

초고속 • 4-6단계 • 텍스트-이미지 + 이미지 편집 • 일체형 • Apache 2.0


✨ FLUX.2 [klein] 4B AIO란?

FLUX.2 [klein] 4B AIO는 블랙 포레스트 랩스의 최신 컴팩트 이미지 생성 모델을 일체형으로 재패키징한 버전입니다. 이 버전은 VAE, 텍스트 인코더(Qwen3), UNet을 단일 파일에 통합해 놓았습니다. 파일을 로드하기만 하면 바로 사용 가능!

**"Klein"**은 독일어로 "작은"을 의미하지만, 이 모델은 그 이름과 달리 제한적이지 않습니다. 일반적으로 훨씬 더 큰 모델에서만 가능했던 텍스트-이미지, 이미지 편집, 다중 참조 생성에서 뛰어난 성능을 발휘합니다.


📦 제공되는 버전

🟡 FP8-AIO (~7.7 GB) – 대부분의 사용자에게 권장

  • 정밀도: FP8
  • UNet: FP8
  • 텍스트 인코더: FP8
  • VAE: BF16
  • 적합 대상: 대부분의 사용자, 빠른 테스트, 일상 사용, 최소 VRAM

🔵 FP16-AIO (~15 GB) – 이전 GPU용

  • 정밀도: FP16
  • UNet: FP16
  • 텍스트 인코더: FP16
  • VAE: BF16
  • 적합 대상: 이전 GPU(GTX 10xx, RTX 20xx), 최대 호환성

🟢 BF16-AIO (~15 GB) – 최고 품질

  • 정밀도: BF16
  • UNet: BF16
  • 텍스트 인코더: BF16
  • VAE: BF16
  • 적합 대상: RTX 30xx/40xx/50xx, 전문/상용 작업

🎯 핵심 기능

  • 4-6단계 생성 – 최신 하드웨어에서 초단속 추론
  • 📦 일체형 – 별도의 VAE/텍스트 인코더 다운로드 불필요
  • 🎨 통합 아키텍처 – T2I, I2I 편집, 다중 참조를 하나의 모델에서 지원
  • 📐 네이티브 1024×1024 – 이 해상도에 최적화됨
  • 💾 저 VRAM – 소비자용 GPU에서도 원활히 실행
  • 📜 Apache 2.0 – 상용 사용 완전 허용!
  • 🔧 LoRA 호환 – 미세 조정에 이상적인 베이스 버전

⚙️ 권장 설정

  • 단계: 4-6 (단계 디스틸링됨, 단계가 더 많다고 해서 더 나은 결과 아님)
  • CFG: 1.0 ⚠️ 필수!
  • 샘플러: euler
  • 스케줄러: simple (또는 "normal")
  • 해상도: 1024×1024 (네이티브)

⚠️ 필수: CFG는 반드시 1.0이어야 합니다!

이 모델은 CFG 1.0에 최적화된 디스틸된 모델입니다. CFG 값이 높을수록 결과가 더 나빠집니다!

✅ CFG 1.0 = 올바름
❌ CFG 3.5+ = 잘못됨, 품질 저하

추가 참고사항

  • 4-6단계가 최적입니다! 이 모델은 빠른 추론을 위해 단계 디스틸링되었습니다.
  • 부정 프롬프트 불필요 – 작동하지만 반드시 필요하지는 않음
  • 자연어 프롬프트 사용 – 원하는 것을 간단히 설명하세요

📥 설치 (ComfyUI)

빠른 시작

  1. 원하는 버전(FP8/FP16/BF16) 다운로드
  2. ComfyUI/models/checkpoints/ 폴더에 배치
  3. "Load Checkpoint" 노드로 로드
  4. 생성!

폴더 구조

ComfyUI/
└── models/
    └── checkpoints/
        └── flux-2-klein-4b-bf16-aio.safetensors  (또는 fp16/fp8)

🎨 예시 프롬프트

사진처럼 사실적인

아늑한 커피숍에서 바리스타가 라테 아트를 만드는 전문 사진, 창문을 통해 들어오는 아침 햇살, 얕은 심도, Sony A7III로 촬영

디지털 아트

결정적인 산봉우리 위에 앉아 있는 장엄한 용, 배경에는 오로라, 판타지 디지털 페인팅, 매우 세밀한 비늘, 극적인 조명

제품 사진

화이트 대리석 위에 놓인 럭셔리 향수 병의 미니멀리스트 제품 사진, 스튜디오 조명, 반사, 상업적 사진

💻 기능

✅ FLUX.2 [klein] 4B가 할 수 있는 것:

  • 텍스트-이미지(T2I) – 텍스트로부터 고품질 이미지 생성
  • 이미지-이미지(I2I) – 단일 참조 편집
  • 다중 참조 – 여러 입력 이미지로 제어된 변형
  • 텍스트 렌더링 – 이미지 내 텍스트 렌더링 향상
  • 사진처럼 사실적 – 프로페셔널 사진 수준 품질
  • 예술적 스타일 – 다양한 예술적 스타일

⚠️ 제한 사항:

  • 1024×1024에 최적화됨 (다른 해상도도 가능하지만 최적은 아님)
  • 4B 모델 – 복잡한 장면에서는 더 큰 모델보다 세부 표현이 부족할 수 있음
  • 디스틸된 버전 – 베이스 모델보다 출력 다양성이 낮음

🔧 기술적 세부사항

  • 파라미터 수: 40억
  • 아키텍처: Rectified Flow Transformer
  • 텍스트 인코더: Qwen3 기반
  • 추론 단계: 4-6 (단계 디스틸링)
  • 네이티브 해상도: 1024×1024
  • 정밀도: BF16 / FP16 / FP8
  • 라이선스: Apache 2.0

🆚 비교: 4B 대 9B

FLUX.2 [klein] 4B

  • 파라미터: 4B
  • VRAM: 약 8-13 GB
  • GPU: RTX 3090/4070+
  • 품질: 매우 좋음
  • 라이선스: Apache 2.0 ✅
  • 상용 사용: 가능!

FLUX.2 [klein] 9B

  • 파라미터: 9B
  • VRAM: 약 29 GB
  • GPU: RTX 4090+
  • 품질: 탁월함
  • 라이선스: 비상용 ❌
  • 상용 사용: 불가

→ 4B는 다음에 완벽합니다: 소비자 하드웨어, 상용 프로젝트, 빠른 반복


❓ 자주 묻는 질문

Q: 별도의 VAE/텍스트 인코더 파일이 필요합니까?

아니요! AIO = 일체형. 모든 것이 단일 파일에 포함되어 있습니다.

Q: 상용 프로젝트에 사용할 수 있습니까?

네! 4B 버전은 Apache 2.0 라이선스를 따릅니다.

Q: 왜 단계가 4-6개뿐입니까?

이 모델은 단계 디스틸링되었습니다. 단계를 더 늘려도 품질이 향상되지 않습니다.

Q: 왜 CFG는 반드시 1.0이어야 합니까?

이 모델은 CFG 1.0에 최적화된 디스틸된 모델입니다. 더 높은 값은 출력 품질을 저하시킵니다.

Q: FP8과 BF16의 차이점은 무엇입니까?

FP8은 더 작고 빠르며, BF16은 약간 더 나은 품질을 제공합니다. 대부분의 용도에서 FP8으로 충분합니다.

Q: LoRA와 호환됩니까?

네! 특히 베이스 버전(디스틸되지 않은)은 LoRA 학습에 이상적입니다.

Q: 9B 버전과의 차이점은 무엇입니까?

9B는 더 나은 품질을 제공하지만 상용 사용이 불가능합니다. 4B는 Apache 2.0 라이선스입니다!


🐛 문제 해결

이미지가 흐릿하거나 과도하게 채도가 높게 보입니다

  • CFG 확인 – 디스틸된 모델은 항상 1.0이어야 합니다!
  • 4-6단계 사용

텍스트 렌더링이 좋지 않습니다

  • 프롬프트에서 더 구체적으로 작성
  • 간단하고 짧은 텍스트 사용
  • 텍스트 관련 요구 사항을 프롬프트 시작 부분에 배치

색상이 이상하게 보입니다

  • FP8 대신 BF16 버전을 시도
  • 모니터가 정확하게 캘리브레이션되었는지 확인

🙏 감사 인사

원본 모델: 블랙 포레스트 랩스
아키텍처: Rectified Flow Transformer
텍스트 인코더: Qwen3
AIO 재패키징: SeeSee21

공식 링크:


📋 변경 사항

v1.0 (2026년 1월)

  • 초기 릴리즈
  • BF16, FP16, FP8 버전 포함
  • VAE + 텍스트 인코더 + UNet을 포함한 일체형

라이선스: Apache 2.0 – 개인 및 상용 사용 모두 무료! 🎉


ComfyUI를 위한 가장 빠른 오픈소스 이미지 생성 모델!

다운로드하고 생성을 시작하세요! 🚀

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.