UltraRealistic Lora Project

详情

下载文件

模型描述

主要目标是生成更“生动”的图像,具有更丰富的情感、更动态的姿势以及略微业余的质感(同时仍可生成高质量图像)。

附注:感谢大家的反馈!我注意到了(不仅在这里,还包括其他地方)关于解剖结构问题的评论,我一直在收集大家提供的报告和示例。我正在考虑几种解决方案来解决这个问题:

  1. 训练一个完整的检查点,这可能是实现一致改进的更合理方式。

  2. 扩展数据集,增加更多涵盖多样姿势的照片,以帮助提升解剖准确性。

非常感谢大家的意见——这对我规划未来的更新帮助极大。

附注2:我已将训练迁移到 RunPod,以获得更稳定、高质量的结果。如果你希望支持我的工作和未来的更新,欢迎前往 Ko-fi 支持我。因为我计划微调一个完整模型,而不仅是一个 LoRa。https://ko-fi.com/danrisi

我在 ComfyUI 中用于 Flux 的设置:
CFG=1,Guidance=2.5,Scheduler=Beta,Sampler=dpmpp_2m,Steps=40,Strength 从 0.8 到 1.0 效果不错,但我通常使用 1;如果手部效果变差,我会设为 0.87。

我在 ComfyUI 中用于 SD3.5 的设置:
CFG=1,Guidance=3.5,Scheduler=sgm_uniform,Sampler=dpmpp_2m,Steps=40,Strength 从 0.5 到 1.0 效果不错,但我通常使用 0.7。

V2 - Flux

为你的创作带来更强的真实感与多功能性,在稳定性、解剖结构和整体质量方面均有显著提升。此更新使 LoRA 更具适应性,让你能根据提示词实现从高清晰度写实到有意降低质量的美学风格的多种效果。

在 1048 张图像上训练而成。

新增内容:

稳定性提升:新版更稳定,对基于文本的提示词响应更好,输出更顺畅、可预测。

手部与解剖结构优化:手部与人体解剖结构更加精细,显著提升真实感。

质量灵活性:配合合适的提示词,可灵活调整输出效果,实现高质量或低质量美学风格(提供示例)。

V1.2 for SD3.5 - Large

我决定为 SD3.5 创建一个几乎使用相同设置的版本。在我看来效果不错,但注意到某些情况下解剖结构存在问题(有时甚至比 Flux 更差),不过其美学表现(色彩、对比度等)反而比 Flux 更出色。我看到 SD3.5 有巨大潜力,未来也可能推出基于 SD3.5 的新版本。

V1.2

更换了数据集中一半的图像,调整了提示风格,改进了手部表现,减少了夜景中的“手电筒效应”,并整体提升了 LoRA 质量(希望如此)。
本版本无需像 V1 那样使用大量“触发词”,只需添加我提到的其中几个即可。

V1

训练了另一个业余 LoRA(这类模型在此地已有很多)。

不过,我还是从我的 2000 年代数据集中选取了一些图片,并额外添加了 700 张。目前效果还不错,但在质量优化方面存在争议:我原本希望这能帮助控制质量,但结果似乎反而让模型更混乱。数据集中包含多种质量层级,例如:

  1. 高分辨率手机拍摄照片,无可见噪点,清晰锐利。

  2. 低分辨率数码相机拍摄的业余照片,无明显 JPEG 压缩伪影,略带噪点。

  3. 中等分辨率手机拍摄照片,因光线不足略显颗粒感,无明显数字伪影。

以及其他各种组合与变体。我认为下一版会移除这些差异。但对我而言,目前效果最好的是:

低分辨率数码相机拍摄的业余照片,无明显 JPEG 压缩伪影,略带噪点。

此模型生成的图像

未找到图像。