UltraReal Fine-Tune

详情

模型描述

V4

好吧,这个版本有什么新内容?我提升了审美强度,增加了年龄多样性,并改进了对亚洲特征的处理。但——因为总有个但书——我发现手部变得有点奇怪了。嗯,不可能样样都完美。

强烈推荐将此模型与我的LoRAs配合使用,例如真实感增强器、2000年代模拟核心等,因为此检查点最适合用作风格化LoRAs的基础。我可能会再发布一个版本(老实说,我确实把v3和v4都搞砸了一点),但首先我要深入微调Flex.Alpha
本次可用版本:bf16、fp8、q8_0 —— 已移除剪枝的fp16命名,q4_k_m —— 已移除剪枝的fp8命名
P.S:请勿将我的UltraRealPhoto LoRA与本检查点一起使用——它会对风格产生巨大影响,导致图像过度渲染。如果您使用的是UltraReal微调版,请改用 真实感增强器 以获得最佳效果。UltraRealPhoto LoRA旨在修复糟糕的阴影、光线和面部,但这些内容已内置于检查点中,您只需添加增强器即可提升真实感

V3更新(实验性)
此次发布标志着向前迈出了一步,尽管仍处于开发中。我专注于改进几个关键方面,如裸体、脚部和下肢解剖结构。虽然结果比以前更好,但仍未能达到我的理想水平。不过,此版本带来了显著的质量与纹理提升,相比前几版输出更加细致和精炼。

推荐设置:

  • CFG Scale: 3(而非早期版本使用的2.5)

  • Steps: 50(有助于稳定性,尽管手部和手指仍存在轻微不稳定性)

  • CFG 0.9 与 1.0: 将CFG降低至0.1甚至0.2有时能改善某些细节(也可能无改善,欢迎自行尝试),但生成时间可能更长。

关于裸体:目前仍未达到预期效果,但我正在积极解决此问题,预计下一版将有改善。

好消息是,我已为V3.5准备好了数据集,目标是以比V2V3之间更短的时间发布。凭借本次版本积累的经验与反馈,我相信下一次更新将带来显著提升。

一如既往,非常感谢您的支持与反馈——这对我的持续优化至关重要 ❤️

P.S.:我感觉越微调Flux,其他方面就越退化。我也在考虑尝试微调Flex Alpha(这个项目看起来非常有前景)

v2.0新增内容?

  • 增强解剖结构:手部、脚部和姿势均有重大改进,效果更自然、准确。告别过度扭曲的肢体!

  • 提升纹理与质量:皮肤细节升级、纹理更丰富、整体图像更清晰。模糊图像仍偶有发生,但频率远低于前一版本或单独使用LoRA时。

  • 改进文字渲染:已努力提升图像中文字生成效果,比之前显著改善。但偶尔仍会出现伪影,有时会显示奇怪符号而非可读文字,此功能仍在持续优化中。

  • 扩展数据集:更大、更多样化的数据集(1800张图像),在风格、光线和构图上实现更均衡的覆盖。


新增检查点变体

为确保兼容不同工作流,我提供了多种检查点变体:

  • BF16

  • FP8

  • 量化8位(Q8)

  • 量化4位(Q4)
    NF4

根据我的测试,量化8位(Q8) 在保持合理资源消耗的同时,比FP8略优,能呈现更精细的细节,但其他版本也表现不错。请选择最适合您设备的版本。


已知限制

  • NSFW能力:仍是本版本的薄弱环节。不过,一个专门针对NSFW内容的微调版本已在筹备中。

  • 文字渲染:虽然文字生成已改善,但偶尔仍会出现奇怪符号或不完整单词。但注意:使用t5xxl fp16而非fp8能大幅提升文字效果


获得最佳效果的建议

  • 采样器:使用DPM++ 2M采样器,以获得平滑且一致的输出。

  • 步数:建议30–50步,在避免过度处理的同时捕捉更精细的细节。

  • 调度器:Beta调度器仍是本检查点的最佳选择。

    提示词建议

    最佳提示词风格是使用复杂提示,以清晰的逗号分隔短语组成。虽然可以发挥创意编写叙事性提示,但无意义的描述如“这垃圾让她的风格更有复古感”并不会提升效果。请保持简洁、具象,专注于关键视觉细节,以获得最佳输出。


未来计划

我将继续致力于此微调模型的开发。下一版将主要聚焦于:

  • 扩展NSFW能力

  • 改进动态姿势与复杂光照等边缘场景

  • 提升文字渲染,实现更清晰、准确的结果

P.S:如果您仍觉得缺乏真实感,请尝试添加我的UltraReal LoRA,这对我的效果帮助很大

Ultra-Realistic Flux 微调版 v1

这是我首次尝试微调检查点,基于我的UltraReal LoRA构建,并扩展了更大的数据集。目标?将真实感推向新高度,在业余审美与专业高质量视觉之间找到完美平衡。

尽管这只是第一版,仍有进一步优化空间——结果不错,但尚未理想(手部和脚部有时会出错,但不严重,仍优于默认Flux)。此微调不仅改善了业余水平输出;它在专业级图像中表现尤为出色,提供卓越的细节、逼真的阴影与光影。这是一个多功能模型,旨在解锁更广泛的写实图像生成可能性。

这仍是一个进行中的项目,我分享出来是为了收集反馈,并看看其他人如何创造性地使用它。如果您尝试了,我很期待听到您的想法或看到您的作品!
此外,我已上传了两个版本:fp16(在ComfyUI中建议搭配e5m2使用)和fp8与q4_0


🌟 此微调版新增内容?

  • 扩展数据集:数据集规模几乎是原LoRA的两倍,涵盖多样风格、光线与构图。

  • 提升真实感:更锐利的细节、更丰富的纹理、更自然的光照,弥合了AI生成图像与真实世界的差距。

  • 多功能性:从休闲的业余快照到电影级专业渲染,此微调版能适应多种创作需求。

  • 增强解剖结构:相比基础Flux模型,手部、四肢和姿势更加自然。


💡 最佳效果建议

  • 使用DPM++ 2M采样器,以获得平滑一致的输出。

  • 设置30–50步,在细节与效率间取得平衡。

  • 选择Beta调度器,实现最佳渲染性能。


为何要微调?

此微调版旨在克服默认Flux模型的部分局限,提升其处理复杂场景的能力,同时在多种提示下保持稳定质量。目标很简单:让超写实图像生成变得易用、可靠、视觉震撼,而无需反复调整。

P.S:我计划继续训练此模型,打造一个拥有最佳解剖结构与真实感的终极检查点。当前版本对NSFW效果不佳(下一版将修复)
P.S.S:目前您可能会随机生成低分辨率图像(尚不清楚具体触发原因,正在寻找解决方案)。但似乎在提示中加入高分辨率有助于缓解此问题

此模型生成的图像

未找到图像。