Flux Nunchaku Ultimate SD Upscale Workflow
세부 정보
파일 다운로드
모델 설명
# 🚀 Nunchaku 설정을 사용한 SD 최종 업스케일러 설정 가이드
이 가이드는 최적의 결과를 위한 Florence2 자동 캡셔닝을 포함하여 Nunchaku와 함께 향상된 SD 최종 업스케일러 워크플로우의 전체 설정을 다룹니다.
## 🔧 사전 요구 사항
- 설치되어 작동 중인 ComfyUI
- NVIDIA GPU (8GB 이상 VRAM, 권장: 12GB 이상)
- CUDA 12.6+ (권장: 12.9)
## 📦 커스텀 노드 설치
### 필수 노드
- [ComfyUI_UltimateSDUpscale](https://github.com/ssitu/ComfyUI_UltimateSDUpscale)
고해상도 이미지용 타일 업스케일링 기능 제공
- [ComfyUI-nunchaku](https://github.com/nunchaku-tech/ComfyUI-nunchaku)
초고속을 위한 양자화된 Flux 모델
- [ComfyUI-Florence2](https://github.com/spacepxl/ComfyUI-Florence2)
더 나은 업스케일링 프롬프트를 위한 자동 이미지 캡셔닝
- [rgthree-comfy](https://github.com/rgthree/rgthree-comfy)
이미지 비교 도구
- [was-node-suite-comfyui](https://github.com/WASasquatch/was-node-suite-comfyui)
고급 저장 옵션
### 설치 방법
- 모든 리포지토리를 ComfyUI/custom_nodes/에 클론하세요
- 설치 후 ComfyUI를 재시작하세요
## 📁 파일 구조 및 모델 다운로드
### 디렉토리 구조
```
ComfyUI/
├── models/
│ ├── checkpoints/ # Nunchaku 모델
│ ├── clip/ # 텍스트 인코더
│ ├── vae/ # VAE 모델
│ ├── upscale_models/ # AI 업스케일러
│ └── loras/ # LoRA 모델 (선택 사항)
```
### 🤖 Nunchaku 모델
출처: mit-han-lab/nunchaku-flux.1-dev
- RTX 20s/30s/40s: svdq-int4_r32-flux.1-kontext-dev.safetensors
- RTX 50 시리즈: svdq-fp4_r32-flux.1-kontext-dev.safetensors
- 설치 위치: models/checkpoints/
### 📝 텍스트 인코더
출처: comfyanonymous/flux_text_encoders
- t5xxl_fp16.safetensors (~9.79GB)
- ViT-L-14-TEXT-detail-improved-hiT-GmP-TE-only-HF.safetensors (~246MB)
- 설치 위치: models/clip/
### 🎨 VAE 모델
출처: black-forest-labs/FLUX.1-schnell
- flux_vae.safetensors (~335MB)
- 설치 위치: models/vae/
### 🔍 업스케일러 모델
권장 옵션:
- 4x_NMKD-Siax_200k.pth
- 4x-UltraSharp.pth
- RealESRGAN_x4plus.pth
- 설치 위치: models/upscale_models/
### 🎯 LoRA 모델 (선택 사항)
- 품질 향상을 위한 사진실감형 LoRA
- 설치 위치: models/loras/Flux/
## 🧠 Florence2 설정
### 모델 다운로드
Florence2는 워크플로우를 처음 실행할 때 자동으로 다운로드됩니다:
- 모델: microsoft/Florence-2-large
- 크기: 약 1.5GB
- 용도: 자동 이미지 분석 및 프롬프트 생성
## 📋 전체 워크플로우 기능
### 🎨 워크플로우 구성 요소
| 노드 | 목적 | 주요 설정 |
|------|---------|--------------|
| LoadImage | 이미지 입력 | 다양한 포맷 지원 |
| Florence2 | 자동 프롬프트 생성 | 이미지 내용 자동 분석 |
| NunchakuFluxDiTLoader | 양자화된 모델 로드 | INT4/FP4 버전 제공 |
| NunchakuFluxLoraLoader | LoRA 강화 적용 | 스타일 향상을 위한 옵션 |
| UltimateSDUpscale | 주 업스케일링 엔진 | 타일 처리 및 이음새 수선 기능 |
| Image Comparer | 전후 비교 | 좌우 비교 시각화 |
## ⚙️ Ultimate SD 업스케일러 설정 (실제 워크플로우 기반)
### 🎯 현재 워크플로우 설정
| 파라미터 | 현재 값 | 목적 | 대안 옵션 |
|-----------|---------------|---------|-------------------|
| upscale_by | 2.0 | 업스케일 배수 | 높은 배율을 위한 4.0, 6.0, 8.0 |
| steps | 20 | 품질 스텝 | 빠른 처리: 12-16, 최고 품질: 26+ |
| cfg | 1.0 | 항상 1.0으로 유지 | Flux 모델에서는 절대 변경 금지 |
| denoise | 0.1 | 보수적 강화 | 더 큰 변화를 원할 경우 0.15-0.30 |
| sampler | "euler" | 샘플링 방법 | dpmpp_2m, dpmpp_sde 대안 |
| scheduler | "normal" | 노이즈 스케줄링 | karras, exponential 옵션 |
### 🧩 타일 처리 설정
| 파라미터 | 현재 값 | 목적 | VRAM 최적화 |
|-----------|---------------|---------|-------------------|
| tile_width/height | 1024 | 처리 단위 | 768 (8-10GB), 512 (6-8GB) |
| mask_blur | 8 | 타일 경계 부드러움 | 부드럽게 하려면 12-16 |
| tile_padding | 32 | 타일 오버랩 | 더 나은 이음새를 위해 48-64 |
### 🔧 이음새 수선 설정
| 파라미터 | 현재 값 | 목적 | 조정 시기 |
|-----------|---------------|---------|----------------|
| seam_fix_mode | "Band Pass" | 타일 경계 수선 | 속도 우선: "None", 대안: "Half Tile" |
| seam_fix_denoise | 1.0 | 이음새 혼합 강도 | 아티팩트 발생 시 감소 |
| seam_fix_width | 64 | 이음새 처리 폭 | 이미지 복잡도에 따라 32-128 |
| seam_fix_padding | 16 | 이음새 오버랩 영역 | 복잡한 이미지일수록 증가 |
## 🎨 Florence2 자동 프롬프트 생성
### 작동 방식
1. 자동 분석: Florence2가 입력 이미지를 분석합니다
2. 캡션 생성: 상세한 설명을 생성합니다
3. 프롬프트 강화: 설명을 기반으로 더 나은 업스케일링 프롬프트를 생성합니다
4. 수동 수정: 생성된 프롬프트는 여전히 직접 편집 가능합니다
### 장점
- 더 나은 결과: AI가 이미지 내용을 정확히 이해합니다
- 일관성: 업스케일링 중 이미지 특징을 유지합니다
- 시간 절약: 이미지를 수동으로 설명할 필요가 없습니다
- 정확성: 중요한 시각적 요소를 보존합니다
## 🚦 최적화 프리셋
### ⚡ 속도 프리셋 (빠른 미리보기)
```json
{
"upscale_by": 2.0,
"steps": 12,
"denoise": 0.1,
"seam_fix_mode": "None"
}
```
### ⚖️ 균형 프리셋 (현재 워크플로우)
```json
{
"upscale_by": 2.0,
"steps": 20,
"denoise": 0.1,
"seam_fix_mode": "Band Pass"
}
```
### 💎 품질 프리셋 (최대 세부 정보)
```json
{
"upscale_by": 4.0,
"steps": 26,
"denoise": 0.2,
"seam_fix_mode": "Band Pass"
}
```
### 🔋 저 VRAM 프리셋 (8GB GPU용)
```json
{
"tile_width": 768,
"tile_height": 768,
"steps": 16,
"seam_fix_mode": "None"
}
```
## 📱 워크플로우 사용 방법
### 단계별 절차
1. 이미지 로드: 이미지를 LoadImage 노드에 드래그
2. 자동 분석: Florence2가 이미지를 자동으로 설명합니다
3. 프롬프트 확인: ShowText 노드에서 생성된 캡션을 확인
4. 설정 조정: 필요 시 업스케일링 파라미터 수정
5. 워크플로우 실행: 전체 파이프라인 실행
6. 결과 비교: Image Comparer로 전후 비교
7. 출력 저장: 타임스탬프 기반으로 자동 저장
### 🎯 프롬프트 사용자 정의
워크플로우는 자동 프롬프트 생성을 사용하지만, 다음과 같이 강화할 수 있습니다:
사진용:
```
[Florence2 caption] + 매우 상세함, 선명한 초점, 프로페셔널 사진, 강화된 디테일
```
아트용:
```
[Florence2 caption] + 생동감 있는 색상, 선명한 선, 프로페셔널 품질, 강화된 디테일
```
## 🔧 문제 해결
### 💥 메모리 문제
- 타일 크기를 768 또는 512로 줄이세요
- 스텝을 12-16로 낮추세요
- 임시로 이음새 수선을 비활성화하세요
- 업스케일 배수를 2x로 줄이세요 (4x 대신)
### 🧩 보이는 이음새
- "Band Pass" 이음새 수선을 활성화한 채로 유지
- tile_padding을 48-64로 증가
- mask_blur을 12-16로 증가
- seam_fix_width이 충분한지 확인 (64-128)
### 🐌 느린 성능
- 스텝을 12-16로 줄이세요
- seam_fix_mode를 "None"으로 설정
- 4x 이상이 아닌 2x 업스케일링 사용
- VRAM 여유가 있으면 타일 크기를 증가
### 🎭 Florence2 문제
- 최초 실행 시 시간이 오래 걸림 (모델 다운로드)
- Florence2가 로드되지 않으면 ComfyUI를 재시작
- 초기 다운로드 시 인터넷 연결 확인
## ⏱️ 성능 벤치마크
| GPU | VRAM | 설정 | 처리 시간 |
|-----|------|----------|-----------------|
| RTX 4090 | 24GB | 2x 업스케일, 1024px 타일, 20 스텝 | 15-30초 |
| RTX 4080 | 16GB | 2x 업스케일, 1024px 타일, 16 스텝 | 25-45초 |
| RTX 3080 | 10GB | 2x 업스케일, 768px 타일, 16 스텝 | 45-75초 |
| RTX 3070 | 8GB | 2x 업스케일, 768px 타일, 12 스텝 | 60-90초 |
## 🎁 워크플로우 장점
### 🚀 속도 장점
- Nunchaku 양자화: 표준 Flux 대비 3-5배 빠름
- 스마트 타일링: 메모리 효율적
- LoRA 통합: 속도 저하 없이 품질 향상
### 🎯 품질 기능
- Florence2 분석: 지능형 프롬프트 생성
- 이음새 수선: 프로페셔널한 타일 혼합
- 비교 도구: 전후 평가가 쉬움
- 유연한 확대: 2x에서 8x까지 확대 옵션
### 🛠️ 사용자 경험
- 자동 워크플로우: 수동 입력 최소화
- 시각적 피드백: 내장된 이미지 비교 기능
- 정리된 출력: 타임스탬프 기반 파일명
- 메모리 효율: 소비자 GPU에서도 작동


