Vision Realistic

详情

模型描述

赞助:
如需赞助,请通过 Discord 联系我们。您的支持将帮助我们成长并改进未来的作品。
购买自定义模型:
如果您有兴趣购买LoRA模型, 联系我们——我们可以在短时间内完成制作。

Vision Realistic Flux dev fp8 模型概览

我很高兴分享我的最新模型——Vision Realistic Flux

我们都清楚,原始的Flux模型已经是目前最优秀的模型之一,因此进一步微调似乎有些多余——老实说,我原本以为这可能是浪费时间。然而,我确实注意到一些问题,比如偶尔出现毫无意义的模糊图像,以及肤色不够自然,尤其是在追求真实效果时。因此,我决定解决这些问题。虽然我对每一个细节都不完全满意,但改进之处确实很明显——对NSFW内容的处理更好、图像更明亮、模糊问题大幅减少。

这个模型比原始Flux更好吗?

不一定,但在某些方面,例如写实风格,它确实表现得更好。最终,这取决于您的审美偏好和具体需求。

我是如何制作这个模型的:

我训练了一些LoRA模型,然后将它们与Flux dev fp8模型合并。在这一过程中,我进行了一些优化。现在,该模型已内置CLIP和VAE,因此您无需使用单独的版本。

如何使用这个模型:

您可以在 ComfyUI 上运行此模型。目前我只在ComfyUI上进行了测试,如果您在其他平台尝试,请在评论区分享您的体验。

工作流

ComfyUI快速参数设置:

  • VAE: 已内置
  • 采样器: Euler
  • 调度器: Simple
  • 采样步数: 20
  • CFG缩放: 1

===========================================================

Vision Realistic

我很高兴推出基于SD3M的最新写实检查点模型。该模型经过超过10万步训练,确保了高质量的输出。

关于此模型:

这是一个照片级写实模型,能够生成逼真的图像,无需任何触发词。该模型专为生成高细节、高分辨率、接近真实照片的效果而设计。

训练配置:

  • GPU: A6000x2
  • 数据集: 5000张图库照片与我自己的数据集混合
  • 批次大小: 8
  • 优化器: AdamW
  • 调度器: 带重启的余弦调度
  • 学习率(LR): 1e-05
  • 训练轮数: 目标300轮
  • 标注: WD14与BLIP混合

重要提示:
请避免在提示词中包含NSFW或成人相关词汇,否则可能导致图像结果不可靠。同时,请避免使用过长的提示词,因为SD3更适合较短的提示词。

快速指南与参数:

  • CLIP编码器: 不需要
  • VAE: 不需要
  • 采样器: dpmpp_2m
  • 调度器: sgm_uniform
  • 采样步数: 25+
  • CFG缩放: 3+

为获得更好效果,建议使用ComfyUI

如果您下载的是不含CLIP的版本,请遵循以下说明:

  1. 此版本无法像普通SD3M模型那样使用,您必须使用“加载扩散模型”功能加载。
  2. 您可以使用其附带的所有SD3M文本编码器。
  3. 您需要一个VAE。下载并将其放入VAE文件夹:ComfyUI\models\vae
  4. 将模型放入UNet文件夹:ComfyUI\models\unet

注意:

此模型并非合并或修改版本,而是原始Realistic Vision的微调模型。一些用户在模型评论区传播了错误信息。如您有任何疑问或想了解更多,请加入我的Discord服务器,或在评论区分享您的想法。感谢您的时间。

此模型生成的图像

未找到图像。