Flux Nunchaku Ultimate SD Upscale Workflow

详情

模型描述

# 🚀 使用 Nunchaku 的 SD 终极放大器设置指南

本指南涵盖使用 Nunchaku 的增强版 SD 终极放大器工作流的完整设置,包括Florence2 自动标注以获得最佳效果。

## 🔧 前置要求

- 已安装并正常运行的 ComfyUI

- 搭载 NVIDIA GPU,显存 8GB 以上(推荐 12GB 以上)

- CUDA 12.6+(推荐 12.9)

## 📦 自定义节点安装

### 所需节点

- [ComfyUI_UltimateSDUpscale](https://github.com/ssitu/ComfyUI_UltimateSDUpscale)

启用高分辨率图像的分块放大

- [ComfyUI-nunchaku](https://github.com/nunchaku-tech/ComfyUI-nunchaku)

用于极速运行的量化 Flux 模型

- [ComfyUI-Florence2](https://github.com/spacepxl/ComfyUI-Florence2)

自动图像标注,以生成更优的放大提示

- [rgthree-comfy](https://github.com/rgthree/rgthree-comfy)

图像对比工具

- [was-node-suite-comfyui](https://github.com/WASasquatch/was-node-suite-comfyui)

高级保存选项

### 安装方法

- 将所有仓库克隆至 ComfyUI/custom_nodes/

- 安装后重启 ComfyUI

## 📁 文件结构与模型下载

### 目录结构

```

ComfyUI/

├── models/

│ ├── checkpoints/ # Nunchaku 模型

│ ├── clip/ # 文本编码器

│ ├── vae/ # VAE 模型

│ ├── upscale_models/ # AI 放大器

│ └── loras/ # LoRA 模型(可选)

```

### 🤖 Nunchaku 模型

来源mit-han-lab/nunchaku-flux.1-dev

- RTX 20/30/40 系列svdq-int4_r32-flux.1-kontext-dev.safetensors

- RTX 50 系列svdq-fp4_r32-flux.1-kontext-dev.safetensors

- 存放位置models/checkpoints/

### 📝 文本编码器

来源comfyanonymous/flux_text_encoders

- t5xxl_fp16.safetensors(约 9.79GB)

- ViT-L-14-TEXT-detail-improved-hiT-GmP-TE-only-HF.safetensors(约 246MB)

- 存放位置models/clip/

### 🎨 VAE 模型

来源black-forest-labs/FLUX.1-schnell

- flux_vae.safetensors(约 335MB)

- 存放位置models/vae/

### 🔍 放大器模型

推荐选项

- 4x_NMKD-Siax_200k.pth

- 4x-UltraSharp.pth

- RealESRGAN_x4plus.pth

- 存放位置models/upscale_models/

### 🎯 LoRA 模型(可选)

- 用于提升画质的写实风格 LoRA

- 存放位置models/loras/Flux/

## 🧠 Florence2 设置

### 模型下载

首次运行工作流时,Florence2 将自动下载

- 模型microsoft/Florence-2-large

- 大小:约 1.5GB

- 用途:自动图像分析与提示生成

## 📋 完整工作流功能

### 🎨 工作流组件

| 节点 | 用途 | 关键设置 |

|------|---------|--------------|

| LoadImage | 输入图像 | 支持多种格式 |

| Florence2 | 自动生成提示 | 自动分析图像内容 |

| NunchakuFluxDiTLoader | 加载量化模型 | 提供 INT4/FP4 变体 |

| NunchakuFluxLoraLoader | 应用 LoRA 增强 | 可选以改善风格 |

| UltimateSDUpscale | 主放大引擎 | 分块处理并修复接缝 |

| Image Comparer | 前后对比 | 并排视觉比较 |

## ⚙️ 终极 SD 放大器设置(来自实际工作流)

### 🎯 当前工作流设置

| 参数 | 当前值 | 用途 | 替代选项 |

|-----------|---------------|---------|-------------------|

| upscale_by | 2.0 | 放大倍数 | 4.0、6.0、8.0(更高放大) |

| steps | 20 | 质量步数 | 12-16(更快)、26+(最高质量) |

| cfg | 1.0 | 必须保持为 1.0 | Flux 模型下禁止更改 |

| denoise | 0.1 | 保守增强 | 0.15-0.30(更强变化) |

| sampler | "euler" | 采样方法 | dpmpp_2m、dpmpp_sde 等替代 |

| scheduler | "normal" | 噪声调度 | karras、exponential 等选项 |

### 🧩 分块处理设置

| 参数 | 当前值 | 用途 | VRAM 优化 |

|-----------|---------------|---------|-------------------|

| tile_width/height | 1024 | 处理块大小 | 768(8-10GB)、512(6-8GB) |

| mask_blur | 8 | 边缘融合 | 12-16(更柔和) |

| tile_padding | 32 | 分块重叠 | 48-64(更好接缝) |

### 🔧 接缝修复设置

| 参数 | 当前值 | 用途 | 调整时机 |

|-----------|---------------|---------|----------------|

| seam_fix_mode | "Band Pass" | 修复分块边界 | "None"(提升速度)、"Half Tile"(备选) |

| seam_fix_denoise | 1.0 | 接缝融合强度 | 若出现伪影则降低 |

| seam_fix_width | 64 | 接缝处理宽度 | 根据图像复杂度调整为 32-128 |

| seam_fix_padding | 16 | 接缝重叠区域 | 复杂图像可增大 |

## 🎨 Florence2 自动提示

### 工作原理

1. 自动分析:Florence2 分析输入图像

2. 生成标注:生成详细描述

3. 增强提示:利用描述改进放大提示

4. 手动调整:仍可编辑生成的提示

### 优势

- 效果更佳:AI 理解图像内容

- 一致性高:放大过程中保留图像特征

- 节省时间:无需手动描述图像

- 精准保留:保留关键视觉元素

## 🚦 优化预设

### ⚡ 速度预设(快速预览)

```json

{

"upscale_by": 2.0,

"steps": 12,

"denoise": 0.1,

"seam_fix_mode": "None"

}

```

### ⚖️ 平衡预设(当前工作流)

```json

{

"upscale_by": 2.0,

"steps": 20,

"denoise": 0.1,

"seam_fix_mode": "Band Pass"

}

```

### 💎 质量预设(最高细节)

```json

{

"upscale_by": 4.0,

"steps": 26,

"denoise": 0.2,

"seam_fix_mode": "Band Pass"

}

```

### 🔋 低 VRAM 预设(8GB 显卡)

```json

{

"tile_width": 768,

"tile_height": 768,

"steps": 16,

"seam_fix_mode": "None"

}

```

## 📱 使用工作流

### 分步流程

1. 加载图像:将图像拖入 LoadImage 节点

2. 自动分析:Florence2 自动描述图像

3. 检查提示:在 ShowText 节点中查看生成的标注

4. 调整设置:如需可修改放大参数

5. 运行工作流:执行完整流程

6. 对比结果:使用 Image Comparer 查看前后对比

7. 保存输出:图像自动按时间戳命名保存

### 🎯 提示自定义

工作流使用自动提示,但可进一步优化:

照片类

```

[Florence2 标注] + 极高细节、清晰对焦、专业摄影、增强细节

```

艺术类

```

[Florence2 标注] + 鲜艳色彩、锐利线条、专业品质、增强细节

```

## 🔧 故障排除

### 💥 内存问题

- 减小分块尺寸至 768 或 512

- 降低 steps 至 12-16

- 临时禁用接缝修复

- 使用更小放大倍数(2x 而非 4x)

### 🧩 明显接缝

- 保持 "Band Pass" 接缝修复启用

- 增加 tile_padding 至 48-64

- 增加 mask_blur 至 12-16

- 确认 seam_fix_width 足够(64-128)

### 🐌 性能缓慢

- 降低 steps 至 12-16

- 将 seam_fix_mode 设为 "None"

- 使用 2x 放大 而非 4x+

- 若显存允许,增大分块尺寸

### 🎭 Florence2 问题

- 首次运行较慢(模型下载中)

- 若加载失败,请重启 ComfyUI

- 检查网络连接 以确保初始下载

## ⏱️ 性能基准测试

| 显卡 | 显存 | 设置 | 处理时间 |

|-----|------|----------|-----------------|

| RTX 4090 | 24GB | 2x 放大,1024px 分块,20 步 | 15-30 秒 |

| RTX 4080 | 16GB | 2x 放大,1024px 分块,16 步 | 25-45 秒 |

| RTX 3080 | 10GB | 2x 放大,768px 分块,16 步 | 45-75 秒 |

| RTX 3070 | 8GB | 2x 放大,768px 分块,12 步 | 60-90 秒 |

## 🎁 工作流优势

### 🚀 速度优势

- Nunchaku 量化:比标准 Flux 快 3-5 倍

- 智能分块:高效内存使用

- LoRA 集成:提升画质而不损失速度

### 🎯 质量特性

- Florence2 分析:智能提示生成

- 接缝修复:专业分块融合

- 对比工具:便捷前后评估

- 灵活放大:支持 2x 至 8x 放大选项

### 🛠️ 用户体验

- 自动化流程:极少手动输入

- 视觉反馈:内置图像对比

- 有序输出:基于时间戳的文件命名

- 内存高效:可在消费级显卡上运行

***

🎯 本增强工作流结合 Nunchaku 的速度、Florence2 的智能与 Ultimate SD 放大器的质量,实现专业级成果,且设置极为简便

此模型生成的图像

未找到图像。