flux_schnell_workflow_12gbvram

세부 정보

파일 다운로드

모델 설명

  • 목표: FLUX.1 schnell (FP8)을 사용하여 12GB VRAM 환경에서 빠르고 VRAM 소모가 적은 T2I 워크플로우 구축.

  • 핵심 아이디어: 단일 체크포인트가 MODEL/CLIP/VAE를 제공하고, 텍스트 조건부는 CLIPTextEncodeFlux(T5 + CLIP-L)를 통해 처리하며, 샘플링은 KSampler Advanced로 수행합니다. LoRA는 **Power LoRA Loader (rgthree)**를 통해 중앙에서 주입됩니다.

의존성 / 모델

  • 체크포인트: FLUX1\flux1-schnell-fp8.safetensorsCheckpointLoaderSimple을 통해 로드 (MODEL/CLIP/VAE 제공).

  • LoRA 주입: Power Lora Loader (rgthree) (하나 또는 여러 LoRA, LoRA별 강도 설정).

  • Comfy-Core 버전: 노드 속성에 comfy-core ver 0.3.49 표시.

그래프 (간소화)

  1. CheckpointLoaderSimpleMODEL, CLIP, VAE

  2. Power Lora Loader (rgthree) → LoRA를 MODEL + CLIP에 주입

  3. CLIPSetLastLayer (선택사항, 여기서는 -1 사용) → 조정된 CLIP를 텍스트 인코더로 전달

  4. CLIPTextEncodeFlux (긍정)T5 문장 + CLIP 태그CONDITIONING으로 결합 (가이던스 조절기 포함)

  5. CLIPTextEncodeFlux (부정) → 선택적 부정 조건부 (여기서 준비됨, 가이던스 포함)

  6. EmptyLatentImage → 시작 레이턴트 (기본: 896×1152, 배치=1)

  7. KSampler Advanced → 샘플링 (스텝/CFG/스케줄러 등)

  8. VAEDecode → 레이턴트를 이미지로 디코딩

  9. SaveImage → 저장 (프리픽스: flux_schnell_fluxText_workflow_v2)

기본 설정 및 권장 사항

  • 해상도: 896×1152로 시작 (12GB 안전), 1024²도 종종 가능

  • 샘플러: KSampler Advanced (예: Euler + normal 스케줄러). 스탭 6–8, CFG = 1.0 (schnell/FP8 체크포인트에 필수)

  • 가이던스 (Flux-Text 노드): 존재함; 초깃값으로 중간 수준 (예: 3.0–4.0) 시작

  • LoRA 강도: 시작값으로 0.6–0.8; 정체성 강도에 따라 미세 조정

입력

  • T5 (문장): 간단하고 명확한 장면 설명 (주제, 장소/조명, 분위기)

  • CLIP-L (태그): 6–10개의 간결한 스타일/기술 태그 (예: photorealistic, soft rim light, sharp eyes, shallow DOF)

  • 부정 (선택사항): 아티팩트 억제용 (로고/제목을 원할 경우 “text/logo” 부정은 사용하지 않음)

출력

  • VAEDecode → SaveImage에서 생성된 8비트 RGB 이미지 (프리픽스는 위 참조)

성능 (12GB)

  • 왜 빠른가?: _FLUX.1 schnell (FP8)_는 디스틸레이션된 모델 → 적은 스텝, CFG 1.0

  • VRAM 팁: 배치=1, 불필요한 추가 인코더 없음, 필요 시 해상도를 64px 단위로 조정

  • 안정성: “드리프트” 발생 시, T5에서 핵심 개념을 강조 (…:1.3) 또는 Conditioning-Weights 활용

베스트 프랙티스

  • 혼동 금지: T5 = 문장, CLIP-L = 태그

  • 프롬프트는 간략히: T5는 1–2문장, CLIP-L은 6–10개 태그

  • LoRA 충돌: 스타일이 과도하게 강조될 경우 LoRA 강도 감소

  • 로고/제목 (예: VOGUE): 부정 프롬프트에 “text/logo/watermark” 포함 금지

문제 해결

  • 프롬프트가 무시됨: CLIPTextEncodeFlux → CLIP 연결이 동일한 로더/LoRA 경로에서 오는지 확인

  • 색상 왜곡/스필: 부정 프롬프트에 no color cast, no neon spill 추가, 또는 긍정 프롬프트에 neutral color rendering 사용

  • 피부가 너무 매끄러움: CLIP-L에 natural skin texture, subtle film grain 추가; 필요 시 해상도 약간 낮춤

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.