ICEdit-workflow

详情

下载文件

模型描述

🔮 用自然语言指令重塑您的图像

无缝编辑的完美伴侣

本指南介绍了使用 FluxFill-DevICEdit-MoE-LoRA 实现强大自然语言图像编辑的完整工作流。

📝 概述:图像编辑的未来已来

ICEdit-MoE-LoRA 代表了 AI 图像编辑的重大突破——一个轻量级的低秩适配(LoRA)模块,为大型扩散变换器带来了专业级的指令驱动编辑能力。通过仅使用原始训练数据的 0.5% 精细调整 1% 的参数,它实现了与高端商业解决方案相当甚至更优的编辑效果。

📌 完整工作流

本工作流结合了 FluxFill + ICEdit-MoE-LoRA,通过自然语言指令编辑图像。为获得更佳效果,可搭配扩散模型如 LEOPARDBernoulliSPEED_Q8,并使用 Gemini 自动提示节点进行 4-8 步处理。(我使用了非常轻量的 Flux 模型,所需步骤更少)

一幅双联画,左右两侧为同一场景。右侧场景与左侧相同,但已应用“您的编辑”(prostyle 已包含,只需填入您的编辑指令)

🛠️ 完整安装指南

📁 目录结构

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │   ├── (基础)📄 fluxfill-dev.safetensors # https://civitai.com/models/1108146/fluxfill-devgguf
│   │   ├──(选项1)📄 LEOPARD.gguf     # https://civitai.com/models/1534861
│   │   ├──(选项2)📄 Bernoulli.gguf  # https://civitai.com/models/682369
│   │   └──(选项3)📄 SPEED_Q8.gguf   # https://civitai.com/models/661102/speedq8
│   ├── 📂 text_encoders/
│   │   ├── (基础)📄 clip_l.safetensors
│   │   ├── (选项1)📄 t5xxl_fp16.safetensors
│   │   ├── (选项2)📄 t5xxl_fp8_e4m3fn.safetensors
│   │   └── (选项3)📄 t5xxl_fp8_e4m3fn_scaled.safetensors
│   ├── 📂 vae/
│   │   └── 📄 ae.safetensors
│   └── 📂 lora/
│       └── 📄 ICEdit-MoE.safetensors

💎 核心组件

✨ LoRA 模型——魔法之钥

🔤 文本编码器——自然语言理解的智能大脑

注意:请根据您的硬件能力仅选择以下 T5XXL 选项之一

🎭 VAE——视觉艺术家

🖼️ 扩散模型——图像生成引擎

##(您只需从以下选项中任选其一,或直接使用 flux-dev,由您决定)

注意: 上述任一扩散模型均可用于高效编辑(推荐 4-8 步)。编辑时使用 flux-dev-fill,提升效果时使用 flux-dev。

🎬 可尝试的示例指令

  • “在背景的山峰上添加一座宏伟的城堡”

  • “将汽车的颜色从红色改为电光蓝”

  • “移除图像中的人物,替换为一棵开花的树”

  • “将风格转换为水彩画,同时保留所有细节”

  • “为场景添加戏剧性的日落光线”

👨‍💻 开发者信息

本工作流指南由 Abdallah Al-Swaiti 创建:

如需更多工具与更新,请查看 OllamaGemini 节点:GitHub 仓库

🙏 社区致谢

特别感谢 sanaka87 通过发布 ICEdit-MoE-LoRA 检查点和演示,彻底革新了开源图像编辑领域。您的贡献赋能了全球创作者,加速了 AI 艺术社区的创新进程!

无替代文本描述

此模型生成的图像

未找到图像。