Flux Nunchaku Ultimate SD Upscale Workflow
详情
下载文件
模型描述
# 🚀 使用 Nunchaku 的 SD 终极放大器设置指南
本指南涵盖使用 Nunchaku 的增强版 SD 终极放大器工作流的完整设置,包括Florence2 自动标注以获得最佳效果。
## 🔧 前置要求
- 已安装并正常运行的 ComfyUI
- 搭载 NVIDIA GPU,显存 8GB 以上(推荐 12GB 以上)
- CUDA 12.6+(推荐 12.9)
## 📦 自定义节点安装
### 所需节点
- [ComfyUI_UltimateSDUpscale](https://github.com/ssitu/ComfyUI_UltimateSDUpscale)
启用高分辨率图像的分块放大
- [ComfyUI-nunchaku](https://github.com/nunchaku-tech/ComfyUI-nunchaku)
用于极速运行的量化 Flux 模型
- [ComfyUI-Florence2](https://github.com/spacepxl/ComfyUI-Florence2)
自动图像标注,以生成更优的放大提示
- [rgthree-comfy](https://github.com/rgthree/rgthree-comfy)
图像对比工具
- [was-node-suite-comfyui](https://github.com/WASasquatch/was-node-suite-comfyui)
高级保存选项
### 安装方法
- 将所有仓库克隆至 ComfyUI/custom_nodes/
- 安装后重启 ComfyUI
## 📁 文件结构与模型下载
### 目录结构
```
ComfyUI/
├── models/
│ ├── checkpoints/ # Nunchaku 模型
│ ├── clip/ # 文本编码器
│ ├── vae/ # VAE 模型
│ ├── upscale_models/ # AI 放大器
│ └── loras/ # LoRA 模型(可选)
```
### 🤖 Nunchaku 模型
来源:mit-han-lab/nunchaku-flux.1-dev
- RTX 20/30/40 系列:svdq-int4_r32-flux.1-kontext-dev.safetensors
- RTX 50 系列:svdq-fp4_r32-flux.1-kontext-dev.safetensors
- 存放位置:models/checkpoints/
### 📝 文本编码器
来源:comfyanonymous/flux_text_encoders
- t5xxl_fp16.safetensors(约 9.79GB)
- ViT-L-14-TEXT-detail-improved-hiT-GmP-TE-only-HF.safetensors(约 246MB)
- 存放位置:models/clip/
### 🎨 VAE 模型
来源:black-forest-labs/FLUX.1-schnell
- flux_vae.safetensors(约 335MB)
- 存放位置:models/vae/
### 🔍 放大器模型
推荐选项:
- 4x_NMKD-Siax_200k.pth
- 4x-UltraSharp.pth
- RealESRGAN_x4plus.pth
- 存放位置:models/upscale_models/
### 🎯 LoRA 模型(可选)
- 用于提升画质的写实风格 LoRA
- 存放位置:models/loras/Flux/
## 🧠 Florence2 设置
### 模型下载
首次运行工作流时,Florence2 将自动下载:
- 模型:microsoft/Florence-2-large
- 大小:约 1.5GB
- 用途:自动图像分析与提示生成
## 📋 完整工作流功能
### 🎨 工作流组件
| 节点 | 用途 | 关键设置 |
|------|---------|--------------|
| LoadImage | 输入图像 | 支持多种格式 |
| Florence2 | 自动生成提示 | 自动分析图像内容 |
| NunchakuFluxDiTLoader | 加载量化模型 | 提供 INT4/FP4 变体 |
| NunchakuFluxLoraLoader | 应用 LoRA 增强 | 可选以改善风格 |
| UltimateSDUpscale | 主放大引擎 | 分块处理并修复接缝 |
| Image Comparer | 前后对比 | 并排视觉比较 |
## ⚙️ 终极 SD 放大器设置(来自实际工作流)
### 🎯 当前工作流设置
| 参数 | 当前值 | 用途 | 替代选项 |
|-----------|---------------|---------|-------------------|
| upscale_by | 2.0 | 放大倍数 | 4.0、6.0、8.0(更高放大) |
| steps | 20 | 质量步数 | 12-16(更快)、26+(最高质量) |
| cfg | 1.0 | 必须保持为 1.0 | Flux 模型下禁止更改 |
| denoise | 0.1 | 保守增强 | 0.15-0.30(更强变化) |
| sampler | "euler" | 采样方法 | dpmpp_2m、dpmpp_sde 等替代 |
| scheduler | "normal" | 噪声调度 | karras、exponential 等选项 |
### 🧩 分块处理设置
| 参数 | 当前值 | 用途 | VRAM 优化 |
|-----------|---------------|---------|-------------------|
| tile_width/height | 1024 | 处理块大小 | 768(8-10GB)、512(6-8GB) |
| mask_blur | 8 | 边缘融合 | 12-16(更柔和) |
| tile_padding | 32 | 分块重叠 | 48-64(更好接缝) |
### 🔧 接缝修复设置
| 参数 | 当前值 | 用途 | 调整时机 |
|-----------|---------------|---------|----------------|
| seam_fix_mode | "Band Pass" | 修复分块边界 | "None"(提升速度)、"Half Tile"(备选) |
| seam_fix_denoise | 1.0 | 接缝融合强度 | 若出现伪影则降低 |
| seam_fix_width | 64 | 接缝处理宽度 | 根据图像复杂度调整为 32-128 |
| seam_fix_padding | 16 | 接缝重叠区域 | 复杂图像可增大 |
## 🎨 Florence2 自动提示
### 工作原理
1. 自动分析:Florence2 分析输入图像
2. 生成标注:生成详细描述
3. 增强提示:利用描述改进放大提示
4. 手动调整:仍可编辑生成的提示
### 优势
- 效果更佳:AI 理解图像内容
- 一致性高:放大过程中保留图像特征
- 节省时间:无需手动描述图像
- 精准保留:保留关键视觉元素
## 🚦 优化预设
### ⚡ 速度预设(快速预览)
```json
{
"upscale_by": 2.0,
"steps": 12,
"denoise": 0.1,
"seam_fix_mode": "None"
}
```
### ⚖️ 平衡预设(当前工作流)
```json
{
"upscale_by": 2.0,
"steps": 20,
"denoise": 0.1,
"seam_fix_mode": "Band Pass"
}
```
### 💎 质量预设(最高细节)
```json
{
"upscale_by": 4.0,
"steps": 26,
"denoise": 0.2,
"seam_fix_mode": "Band Pass"
}
```
### 🔋 低 VRAM 预设(8GB 显卡)
```json
{
"tile_width": 768,
"tile_height": 768,
"steps": 16,
"seam_fix_mode": "None"
}
```
## 📱 使用工作流
### 分步流程
1. 加载图像:将图像拖入 LoadImage 节点
2. 自动分析:Florence2 自动描述图像
3. 检查提示:在 ShowText 节点中查看生成的标注
4. 调整设置:如需可修改放大参数
5. 运行工作流:执行完整流程
6. 对比结果:使用 Image Comparer 查看前后对比
7. 保存输出:图像自动按时间戳命名保存
### 🎯 提示自定义
工作流使用自动提示,但可进一步优化:
照片类:
```
[Florence2 标注] + 极高细节、清晰对焦、专业摄影、增强细节
```
艺术类:
```
[Florence2 标注] + 鲜艳色彩、锐利线条、专业品质、增强细节
```
## 🔧 故障排除
### 💥 内存问题
- 减小分块尺寸至 768 或 512
- 降低 steps 至 12-16
- 临时禁用接缝修复
- 使用更小放大倍数(2x 而非 4x)
### 🧩 明显接缝
- 保持 "Band Pass" 接缝修复启用
- 增加 tile_padding 至 48-64
- 增加 mask_blur 至 12-16
- 确认 seam_fix_width 足够(64-128)
### 🐌 性能缓慢
- 降低 steps 至 12-16
- 将 seam_fix_mode 设为 "None"
- 使用 2x 放大 而非 4x+
- 若显存允许,增大分块尺寸
### 🎭 Florence2 问题
- 首次运行较慢(模型下载中)
- 若加载失败,请重启 ComfyUI
- 检查网络连接 以确保初始下载
## ⏱️ 性能基准测试
| 显卡 | 显存 | 设置 | 处理时间 |
|-----|------|----------|-----------------|
| RTX 4090 | 24GB | 2x 放大,1024px 分块,20 步 | 15-30 秒 |
| RTX 4080 | 16GB | 2x 放大,1024px 分块,16 步 | 25-45 秒 |
| RTX 3080 | 10GB | 2x 放大,768px 分块,16 步 | 45-75 秒 |
| RTX 3070 | 8GB | 2x 放大,768px 分块,12 步 | 60-90 秒 |
## 🎁 工作流优势
### 🚀 速度优势
- Nunchaku 量化:比标准 Flux 快 3-5 倍
- 智能分块:高效内存使用
- LoRA 集成:提升画质而不损失速度
### 🎯 质量特性
- Florence2 分析:智能提示生成
- 接缝修复:专业分块融合
- 对比工具:便捷前后评估
- 灵活放大:支持 2x 至 8x 放大选项
### 🛠️ 用户体验
- 自动化流程:极少手动输入
- 视觉反馈:内置图像对比
- 有序输出:基于时间戳的文件命名
- 内存高效:可在消费级显卡上运行
***
🎯 本增强工作流结合 Nunchaku 的速度、Florence2 的智能与 Ultimate SD 放大器的质量,实现专业级成果,且设置极为简便


