Vision Realistic
详情
下载文件
模型描述
赞助:
如需赞助,请通过 Discord 联系我们。您的支持将帮助我们成长并改进未来的作品。
购买自定义模型:
如果您有兴趣购买LoRA模型, 联系我们——我们可以在短时间内完成制作。
Vision Realistic Flux dev fp8 模型概览
我很高兴分享我的最新模型——Vision Realistic Flux
我们都清楚,原始的Flux模型已经是目前最优秀的模型之一,因此进一步微调似乎有些多余——老实说,我原本以为这可能是浪费时间。然而,我确实注意到一些问题,比如偶尔出现毫无意义的模糊图像,以及肤色不够自然,尤其是在追求真实效果时。因此,我决定解决这些问题。虽然我对每一个细节都不完全满意,但改进之处确实很明显——对NSFW内容的处理更好、图像更明亮、模糊问题大幅减少。
这个模型比原始Flux更好吗?
不一定,但在某些方面,例如写实风格,它确实表现得更好。最终,这取决于您的审美偏好和具体需求。
我是如何制作这个模型的:
我训练了一些LoRA模型,然后将它们与Flux dev fp8模型合并。在这一过程中,我进行了一些优化。现在,该模型已内置CLIP和VAE,因此您无需使用单独的版本。
如何使用这个模型:
您可以在 ComfyUI 上运行此模型。目前我只在ComfyUI上进行了测试,如果您在其他平台尝试,请在评论区分享您的体验。

ComfyUI快速参数设置:
- VAE: 已内置
- 采样器: Euler
- 调度器: Simple
- 采样步数: 20
- CFG缩放: 1
===========================================================
Vision Realistic
我很高兴推出基于SD3M的最新写实检查点模型。该模型经过超过10万步训练,确保了高质量的输出。
关于此模型:
这是一个照片级写实模型,能够生成逼真的图像,无需任何触发词。该模型专为生成高细节、高分辨率、接近真实照片的效果而设计。
训练配置:
- GPU: A6000x2
- 数据集: 5000张图库照片与我自己的数据集混合
- 批次大小: 8
- 优化器: AdamW
- 调度器: 带重启的余弦调度
- 学习率(LR): 1e-05
- 训练轮数: 目标300轮
- 标注: WD14与BLIP混合
重要提示:
请避免在提示词中包含NSFW或成人相关词汇,否则可能导致图像结果不可靠。同时,请避免使用过长的提示词,因为SD3更适合较短的提示词。
快速指南与参数:
- CLIP编码器: 不需要
- VAE: 不需要
- 采样器: dpmpp_2m
- 调度器: sgm_uniform
- 采样步数: 25+
- CFG缩放: 3+
为获得更好效果,建议使用ComfyUI
如果您下载的是不含CLIP的版本,请遵循以下说明:
- 此版本无法像普通SD3M模型那样使用,您必须使用“加载扩散模型”功能加载。
- 您可以使用其附带的所有SD3M文本编码器。
- 您需要一个VAE。下载并将其放入VAE文件夹:
ComfyUI\models\vae。 - 将模型放入UNet文件夹:
ComfyUI\models\unet。

注意:
此模型并非合并或修改版本,而是原始Realistic Vision的微调模型。一些用户在模型评论区传播了错误信息。如您有任何疑问或想了解更多,请加入我的Discord服务器,或在评论区分享您的想法。感谢您的时间。




















