Fresh Photo (realism eddiemauro-mix)
详情
下载文件
模型描述
使用前须知
你需了解 Stable Diffusion 的工作原理。我建议使用 Automatic1111 作为界面来启动模型。
本模型基于 SD 1.5 模型,因此请注意它并非完美。在达到稳定生成效果之前,我经历了大量测试。当出现更优的基础模型(如新的 SD XL)时,我将对模型进行优化升级。
这是一个 Checkpoint 数据集。
本模型为合并模型,因此需注意其偶尔可能生成 NSFW 内容。请在负向提示中加入 "nudes"。
我建议关注我的 Instagram 账号,我将在其中分享有关 AI 图像生成的讲解:https://www.instagram.com/eddiemauro.design/
简介
FRESH PHOTO(写实风格 eddiemauro-mix)CHECKPOINT:大家好,我是一名产品与汽车设计师,非常兴奋能通过 AI 进行创作,我认为这是设计过程中的一个绝佳工具。
v1:由多个写实风格模型整合而成,适用于多种摄影类型。我的目标是打造一个通用模型,用于生成写实图像。
v1.5:提示词优化,一致性提升。色彩更鲜艳。种族多样性更好。细节表现更佳。
v2.0:细节更丰富,写实度更高,分辨率更优。形状一致性更好。暖色调滤镜减弱。种族多样性表现更佳。总体优于 v1.5,但某些特定表现方面,v1.5 仍略胜一筹。
v2.5(+ inpainting):整体优于 v2。
v2.5 LCM:整体优于 v2。相比 v2.5 正常版本更暗,细节更丰富。可与 Euler-a Normal 或 LCM Normal 一同使用。CFG 值 1-2,步骤 5-20。注意:此处图像示例使用的是 1.5 版本的 CFG 设置,Civitai 元数据信息不准确。

如果你想支持我的工作,并帮助我上传更多高质量的模型,可通过以下链接捐赠,我将非常感激:https://ko-fi.com/eddiemauro
安装说明
我使用 Automatic1111——Stable Diffusion 图像生成的最佳 UI,因此建议你本地安装,或使用 Colab 等在线平台运行。你可以在网上找到相关安装指南或视频教程。若选择本地安装,建议观看此在线教程:https://www.youtube.com/watch?v=kqXpAKVQDNU&ab_channel=SebastianKamph。我建议你至少配备 6-8GB 显存的 NVIDIA 显卡,以获得稳定界面。此外,建议使用“Microsoft Edge”而非“Google Chrome”进行运行。同时,建议安装 “medvram” 或 “lowvram” 选项,以及 “xformers”(请在网上搜索如何配置)。
你需要安装此 Checkpoint 模型才能使用。
请务必遵循我所有的图像生成建议,若不遵循,将无法产出高质量图像。请同时注意,当前 AI 图像生成仍不够稳定与完美,你需要投入时间反复测试才能取得理想效果。
图像生成推荐
激活标记/标题:在提示词开头添加 "RAW photo of" 或 "Analog photo of",以增强图像真实感,但并非强制。
提示词推荐:在正向提示中可使用以下词汇提升生成质量:正向空间:“Photorealistic, Hyperrealistic, Hyperdetailed, detailed skin, soft lighting, subsurface scattering, realistic, masterpiece, best quality, ultra realistic, 8k, Intricate, High Detail, film photography, soft focus”;负向空间:“((nsfw)), ((asian)), Japanese, Korean, Chinese, ((disfigured)), ((deformed)), ((extra limbs)), (((duplicate))), ((morbid)), ((mutilated)), out of frame, extra fingers, mutated hands, poorly drawn eyes, ((poorly drawn hands)), ((poorly drawn face)), (((mutation))), ((ugly)), blurry, ((bad anatomy)), (((bad proportions))), cloned face, body out of frame, out of frame, bad anatomy, gross proportions, (malformed limbs), ((missing arms)), ((missing legs)), (((extra arms))), (((extra legs))), (fused fingers), (too many fingers), (((long neck))), tiling, mutated, cross-eye, canvas frame, frame, cartoon, 3d, weird colors, blurry, cgi, 3d, render, sketch, cartoon, drawing, anime, cropped”。你也可以参考此处示例图像的元数据,模拟提示词。为准确呈现不同种族特征,建议使用 此网站 生成人名,仅选取首尾姓名组合。
提示词推荐(v2.5):简洁为佳,仅需在正向提示中使用 “RAW photo of”、“Photo of” 或 “Analog photo of”;负向提示中使用:“nudes, asian, worst quality, normal quality, bad quallity, text, artifacts, bad eyes, strabismus, deformed, cartoon, render”。该版本生成图像以亚裔人物为主,若想避免,可在负向提示中加入 “asian”。
文本反转/嵌入或 LoRA 工具推荐:我推荐使用“EasyNegative”作为负向提示空间的最佳文本反转模型,务必使用。下载地址,并将其文件放入“embeddings”文件夹中。同时可使用“Detail Tweaker”LoRA 来增强图像细节。请从此处下载,按 LoRA 方式安装,并在正向提示中使用,权重设为 “1”。仅当发现Checkpoint生成的图像细节不足时,才使用该 LoRA;若图像是极简风格,则不建议使用。该“Detail Tweaker”仅限在 img2img 模式启用,需在批处理生成后使用。你也可尝试其他 LoRA,如 "Epi noiseoffset",可提升对比度。
文本反转/嵌入或 LoRA 工具推荐(v2.5):保持简洁,无需使用嵌入或复杂词汇。正向提示中仅使用“Detail Tweaker”LoRA 即可,若发现图像细节不足时再启用。
VAE:建议优先使用标准 Stable Diffusion 的 “vae-ft-mse-840000-ema-pruned”。v1.5 和 v2 版本的 VAE 已内嵌。该照片风格为图像略带暖黄色调,同时轻微降低色彩饱和度。v1.5 版本因 VAE 内嵌,整体色彩反而更鲜艳一些。
Clip Skip:为追求更高真实感,请使用 "1";仅在实验时可使用 "2"。
步数与 CFG:建议步数设置在 30–50 之间,CFG 值设为 6–8,理想配置为步数 30,CFG 7。未来版本配置可能调整。有时发现 CFG 9 配合 40–50 步数效果良好。若 CFG 超过 10 且步数过高,往往开始失效。对于 v2.5 版本,建议设置为 30 步,CFG 6。LCM 可搭配 Euler-a Normal 或 LCM Normal 使用。CFG 1–2,步数 5–20。
采样器:我主要使用 “DPM++SDE Karras”。Euler 算法更简洁,但细节较少。若你喜欢,可尝试其他采样器。
批处理:在 txt2img 模式中,建议设置批处理值为 4,以生成多张图像并观察结果。若你显卡性能较强,可使用“Batch size”生成同时四张图像,虽然生成时间增加;若电脑性能不足,建议改为“Batch count”,即顺序生成四张图像,虽然生成时间更长。
图像比例:建议使用如 512x512、768x512、512x768 等尺寸。也可尝试其他尺寸,但请勿生成过大图像,以免风格丢失。若需更大尺寸,可使用 txt2img 模式下的 hires.fix 功能,或 img2img 提升法,亦可使用 Ultimate SD Upscale 脚本扩展 + ControlNet,或直接使用 GAN 模型进行放大。
生成大图:Stable Diffusion 中有四种不同方法可生成大图,你可在网络上查找具体操作方法。第一种方法为 “txt2img hires.fix”,我推荐使用名为 “4x-UltraSharp” 的放大模型,可在此下载 仅 .pth 文件,然后将其安装至 “ESRGAN” 文件夹中。在 hires.fix 选项中设任意“放大倍数”,再将“降噪强度”设为 0.5–0.7。第二种方法:先在 txt2img 中生成图像,再切换至 img2img 模式,将尺寸至少放大 1.5 倍,降噪强度设为 0.3–0.5。第三种方法:使用与 img2img 类似的配置,但激活 ControlNet 扩展的“tile”模式,同时启用 “Ultimate SD Upscale” 脚本,但建议参考此教程 学习。第四种方法:将 txt2img 生成的图像导入“extras”板块,选择 GAN 模型并进行放大,也可选用 “4x-UltraSharp”、“4xNMKD-SIAX_200k” 或 “4xUniscaleV2-Moderate”。v2.5 版本推荐使用:“8x-NMKD-Superscale_150000_G” 模型。
提升创作控制力:请使用“ControlNet”扩展来生成更具控制性的图像结构,也可尝试使用草图测试。推荐使用“Scribble”或“Lineart”模式。建议安装该扩展并学习使用方法,网上有大量相关视频教程。
复制提示词以保留图像元数据:你可在此下载我的示例图像,并将其放入 Automatic1111 的“PNG info”标签页中。
示例提示词:
正向提示词:
RAW photo of Gotzon Otxoa 穿着休闲服装,微笑微露,细节丰富,照片级真实,超真实感照片,8k uhd,dslr,柔和光影,高质量,胶片颗粒,Fujifilm XT3,(masterpiece) lora:add_detail:1
正向提示词 v1.5–2:
RAW photo of Muirgheal MacCarrick 穿毛衣,红发,Photorealistic,Hyperrealistic,Hyperdetailed,detailed skin,soft lighting,subsurface scattering,realistic,masterpiece,best quality,ultra realistic,8k,Intricate,High Detail,film photography,soft focus
负向提示词(简化版):
EasyNegative,((nsfw)),((asian)),Japanese,Korean,Chinese。
负向提示词(完整版):
((nsfw)),((asian)),Japanese,Korean,Chinese,((disfigured)),((deformed)),((extra limbs)),(((duplicate))),((morbid)),((mutilated)),out of frame,extra fingers,mutated hands,poorly drawn eyes,((poorly drawn hands)),((poorly drawn face)),(((mutation))),((ugly)),blurry,((bad anatomy)),(((bad proportions))),cloned face,body out of frame,out of frame,bad anatomy,gross proportions,(malformed limbs),((missing arms)),((missing legs)),(((extra arms))),(((extra legs))),(fused fingers),(too many fingers),(((long neck))),tiling,mutated,cross-eye,canvas frame,frame,cartoon,3d,weird colors,blurry,cgi,3d,render,sketch,cartoon,drawing,anime,cropped,Easynegative
步数:30–50(建议使用 DPM++SDE Karras;有时 EulerA 也可行,但会损失细节)
CFG 值:7–9(推荐 8)
若你希望避免亚裔人物,可移除 "((asian)), Japanese, Korean, Chinese"。经过大量尝试与调整,我发现对于负向提示,仅使用 "EasyNegative" 嵌入已足够,但在 v1.5–2.0 版本中需要更完整的负向提示。
v2 示例提示词:
正向提示词:
RAW photo of Isaura Ojeda 穿着休闲服装,微笑微露,真实感,城市街道 lora:General-Design\\add_detail:0.7
负向提示词(简化版):
nudes,asian,worst quality,normal quality,bad quallity,text,artifacts,bad eyes,strabismus,deformed,cartoon,render
步数:30–50(建议使用 DPM++SDE Karras;有时 EulerA 也可行,但会损失细节)
CFG 值:6–7。LCM:可与 Euler-a Normal 或 LCM Normal 搭配使用。CFG 1–2,步骤 5–20。
若你意图生成非亚裔人脸,可移除 "asian"。
未来展望
我正尝试进一步优化本模型。本次训练使用 512 像素比例,未来我将尝试使用 768(更大尺寸)及其它配置(如调整标题、步数、训练周期等)。如果你希望获得更优版本的模型,请持续支持我于 ko-fi。若支持者更多,我将有更多时间投入训练与模型优化;否则我将难以实现。

我已发布第一个私有模型,名为“eddiemauro scene”,专为我的ko-fi 会员 lv.1 提供,可用于创作极简风景渲染。若你希望访问私有模型,可通过支持我并订阅此会员获取。未来我也将在此上传更多聚焦于产品与汽车设计的模型。
许可协议
请查阅 Stable Diffusion 许可证链接。本模型仅限用于实验目的。禁止以下行为:
未经本人同意,将本模型上传至任何服务器或公开在线网站。
未经本人同意,在线分享本模型,无论使用别名或在收费图像生成服务中运行。
将其与 Checkpoint 或 LoRA 合并后发布或共享,须先与我联系。未来禁止:
卖出本模型或基于本模型的合并版本。
支持方式
你可关注我的社交媒体账号,我将分享创作流程、设计技巧与工具。也可访问我的个人网页,如需设计服务,我可提供自由职业设计服务。
https://www.facebook.com/eddiemauro.design
https://www.instagram.com/eddiemauro.design




















