PixelWave

详情

模型描述

PixelWave FLUX.1-schnell 04 - Apache 2.0!

Safetensor 文件: 💾BF16 💾FP8 💾bnb FP4

GGUF 文件: 💾Q8_0 🤗Q6_K 💾Q4_K_M

链接到 🤗VAE 🤗T5xxl 🤗CLIP L

该模型亦可在以下平台获取: RunDiffusion Runware.ai

PixelWave FLUX.1 schnell 版本 04 是对 FLUX.1-schnell 的美学微调。训练图像经过精心挑选,以确保模型倾向于生成引人注目的图像,具有美丽的色彩、纹理和光照效果。

  • 基于原始 schnell 模型训练,因此采用 Apache 2.0 许可证!

  • 无需特殊要求即可运行,支持 FLUX LoRAs

  • Euler Normal,8 步。

您可以使用更多步骤以改善细节,但超过 8 步后输出变化不大。

特别感谢 RunDiffusion

衷心感谢 RunDiffusion(Juggernaut 的联合创作者)赞助了训练此模型所需的计算资源!在不“去蒸馏”模型的前提下训练 schnell 需要大量实验,而能够使用 RunDiffusion 的云计算使这一过程变得容易得多。

如需通过 API 访问此模型,我们已与 Runware.ai 建立合作。

目前,FLUX.1-dev 04 版本独家提供给 RunDiffusion 和 Runware。当我未来发布版本 05 时,我计划开源 dev 04 的权重。

感谢他们支持本模型的发布,请查看他们

训练信息

训练使用了 kohya_ss/sd-scripts。我的 Kohya 分支可在此找到:点击此处,其中也包含了对 sd-scripts 子模块的修改,请确保同时克隆两者。

请使用微调选项卡。我发现使用 pagedlion8bit 优化器效果最佳,它也能在我的 4090 24GB GPU 上运行。其他优化器似乎难以有效学习。

我已冻结了 time_in、vector_in 和 mod/modulation 参数,以阻止“去蒸馏”现象。

我避免训练超过第 15 个区块。您可在 FLUX 部分设置要训练的区块。

学习率 5e-6 训练速度快,但几千步后开始出现区块损坏并减缓学习速度。

您可以将此模型与早期检查点进行块合并,替换损坏的区块,然后继续训练。

损坏区块的迹象:大多数图像出现纸张纹理,背景细节丢失。

联系我们

如需商业或合作咨询,请发送邮件至 [email protected]。我们提供 FLUX 微调授权、客户训练项目与商业 AI 开发服务,团队可胜任一切!

PixelWave Flux.1-dev 03 微调版!

Safetensor 文件: 💾BF16 💾FP8 💾NF4

GGUF 文件: 💾Q8_0 🤗Q6_K 💾Q4_K_M

链接到 🤗VAE 🤗T5xxl 🤗CLIP L

“diffusers” 文件实际为 Q8_0 和 Q4_K_M 的 GGUF 版本。GGUF 文件亦可在 Hugging Face 获取。

我在 4090 显卡上花了五周以上时间,基于基础 FLUX.1-dev 对版本 03 进行了微调。它能够生成多种艺术风格、摄影风格和动漫风格。我发现的一个有助于 LoRA 使用的小技巧。

展示图使用了 dpmpp 2m sgm uniform,30 步。如需更干净的输出,请尝试提高引导系数。同时明确提及风格有助于模型理解,减少猜测。

我还建议使用“放大潜在变量”节点,将潜在变量放大 1.5 倍,例如生成 1536x1536 而非 1024x1024 的图像。

PixelWave Flux.1-schnell 03

Safetensor 文件: 💾FP8 💾NF4

GGUF 文件: 前往 Hugging Face

展示图使用了 dpmpp 2m sgm uniform,8 步。

您可以从 4 步开始,但使用更多步骤能减少人体结构错误。

PixelWave Flux.1-dev 02

Safetensor 文件: 💾BF16 💾FP8

GGUF 文件: 💾Q8_0 🤗Q6_K 💾Q4_K_M

版本 02 显著提升了黑色及暗色图像的质量,手部问题也更少。

推荐使用 dpmpp_2s_ancestral,beta,14 步。或使用 euler,simple,20 步。

Comfyui-GGUF 节点

PixelWave 11 SDXL. 通用型微调模型,非常适合艺术与摄影风格。

我使用 20 步,DPM++ SDE,CFG 4 至 6;或 40 步,2M SDE Karras

加速版本 - 5+ 步,DPM++ SDE Karras,CFG 2.5

推荐使用 PAG⚡推荐缩放 1.5,CFG 3。 工作流链接

🔗扩展图库链接 🖼️

提示词指南链接⭐ 除非您特意需要,否则无需使用“4K、8K、杰作、高清、高质量”等质量词汇。如追求自然风格,我建议避免使用“鲜艳、强烈、明亮、高对比、霓虹、戏剧性”等词,这些词可能导致画面“过饱和”,但其实只是 CLIP 严格遵循了您的提示。🙂 如果您确实想要鲜艳或霓虹风格,PixelWave 也能完美呈现!

版本 10 的重点是训练 CLIP 模型,从而提升稳定性、确保能生成多样风格,并更准确地响应提示词。

感谢以下朋友协助测试:masslevelblinksocalguitaristklinterwizard whitebeard

指南:使用 LM Studio 和 Mikey 节点提升提示词

指南:使用跳步法为图像添加更多细节

无需使用精修模型。

此模型并非其他模型的混合体。

我还创建了 Mikey Nodes,其中包含大量实用节点,可通过 Comfy Manager 安装。

此模型生成的图像

未找到图像。