CognitiveRiver
详情
下载文件
关于此版本
模型描述
新目标
我本想为新模型起个新名字,因为我的原始目标是4步和皮肤纹理。这个新模型在11-15步时表现最佳,但皮肤细节依然不错(尽管如果你拿它和某些FLUX模型对比,可能会感到失望)。让我对真实感模型产生兴趣的,是它们对非真实风格提示缺乏支持;如果我想输入非真实的肤色,比如蓝色或紫色,以及眼睛颜色(如红色或紫色),我根本做不到。因此,这次我的目标是保持真实感,同时能够生成奇幻/科幻风格的内容。
我花了很多时间开发这个模型,但我不会收费……所以非常感谢打赏。
Illustrious
这是我首次尝试Illustrious模型。我几乎已经完成了一个Pony v3版本,也许我最终还是会完成它,但最近似乎对它兴趣不大(欢迎反馈)。无论如何,为Illustrious开发真实风格非常困难。我最初被吸引是因为v-pred中的光影对比,我尝试创建一个版本,但在多次失败后,我暂时放弃了。我仍认为这个版本在光影控制上有不错的表现,但不如v-pred可能达到的效果。不过许多Illustrious模型要么皮肤过于平滑,要么出现奇怪的胶片颗粒感,看起来斑驳不均,所以我决定试试看。
我从零开始训练这个模型,使用了约1500张我手动打标签的图像。我的目标是为用户提供大量控制词……我仍在努力寻找令牌数量、自然提示和填充之间的最佳平衡,因此标签未必总是有效。该模型还是一个DMD2模型,因此需要在CFG引导和步数之间做权衡。我未来肯定会继续在新版本中调整它。
这是一个高分辨率模型。它是在1280像素图像上训练的。
设置
VAE: VAE已内置。
采样方法: 此次Euler A效果最佳,我想保持简单。LCM也可以使用,但它往往会平滑皮肤和纹理细节,但你可能喜欢这种效果。一个小技巧是:用LCM作为主采样器,再用Euler A进行高清修复,以恢复更多细节。
调度类型: Karras效果最好,Align Your Steps和Turbo也不错。
步数: 如上所述,我将步数平衡在11-15之间。如果你想达到4-5步范围,可以混合使用lora:dmd2_sdxl_4step_lora:0.4。但这样会牺牲一些细节,且你对CFG(本已受限)的调节范围也会变得有限。
CFG比例: 1 - 2之间。数值越低,色彩越中性真实;数值越高,色彩越鲜艳。但我要提醒你:如果你使用较低数值,将限制你使用负面提示的能力(如果你需要它的话)。在CFG=1时,负面提示失效;在1.5时,我很难让负面提示保持一致性;我发现当CFG=2时,模型才真正开始“听从”负面提示。如果你使用上面提到的4-5步范围,CFG将被限制在1 - 1.25(同样限制了负面提示效果)。
分辨率: 这是一个高分辨率模型,最佳比例为1280,但你完全可以使用1024分辨率。
1280x1280
1152x1408
1024x1536
896x1664
高清修复: 由于分辨率已经很高,我会将“放大倍率”限制在1.25。你可以用到1.5,但会很慢。我使用4x_NMKD-Superscale-SP_178000_G作为首选放大器。步数与采样一致。去噪强度设为0.25,属于标准设置。
标签指南
本指南为参考,不代表模型总会遵循,且Illustrious本身拥有海量标签,本指南也非详尽。
质量
你不需要用“masterpiece”、“very awa”、“year 5000”这类填充标签。如果你想用,也可以,但在我看来,这是浪费一个令牌。如果你想强调质量,可以用包含“quality”或“resolution”的词,如“best quality”、“high quality”、“amazing quality”、“high resolution”,或在负面提示中使用“bad quality”、“low resolution”。这些其实没必要,模型默认输出质量就相当不错。
摄影
镜头景别:
Closeup / Portrait, Medium Shot, Cowboy Shot, Full Shot
这个让我很头疼,我会持续改进。我原本有更多标签,但效果极不稳定。
角度/方向:
High Angle / From Above
Low Angle / From Below
Side View
Back View / From Behind
Upside Down (头部离相机比身体更近)
Titled Angle, Dutch Angle (之前有效,现在不行了)
焦点: 在近景时,说出你希望聚焦的身体部位。例如:
Feet Focus, Face Focus, Back Focus, Breast Focus, Butt/Ass Focus……你懂的。
风格
Realistic Style, Anime Style
基础风格(无需添加):我自己的个人风格,也是默认风格
真实风格:更像照片,更多皮肤瑕疵、皮肤细节,减少下巴凹陷,人种多样性更丰富
动漫风格:皮肤更平滑,眼睛更大,发色和发型、面部表情更多样

角色扮演
这仍处于实验阶段。我曾在未发布的Pony 3模型中做得非常好。唉。无论如何,如果你添加标签 cosplay,它会让角色看起来像是在装扮成该人物,而不是直接长得像那个人。我仍在优化这个功能,配合真实风格效果更佳。
无人物
我意识到这方面的表现不够好,这是需要改进的领域。但如果你想避免出现人物,这里有一些提示:
使用你想要的主体,再加上摄影类型。例如:
Food Photography, Landscape Photography, Macro Photography, Product Photography, Wildlife Photography
No person, No People
光照
并非所有标签都总有效,但可以尝试:
dim lighting
Dark lighting / room
studio lighting
natural lighting
soft lighting
candlelit lighting
indoor lighting
outside lighting
bright lighting
moody lighting
dramatic lighting
stage lighting
[color] lighting / filter. 最佳搭配:Dim Lighting 和 Dark Room / Lighting

身体
肤色:
fair skin, light skin, pale skin, olive skin, tan skin, medium skin, dark skin, black skin, white skin, grey skin, red skin, orange skin, yellow skin, green skin, blue skin, purple skin


体型/轮廓:
Thin, Petite, Slender, Slim, Curvy, Chubby, Fat, Athletic, Muscular, Thick Thighs, Thigh Gap
胸部控制:
flat chest, small boobs, perky breasts, medium boobs, large boobs, huge boobs. 可使用boobs或breasts
臀部控制:
small butt, large / round butt, big / huge butt
面部控制:
High Cheekbones
Sharp Face
Round Face
Long Face
Cute Nose (呈现更圆润的鼻子)
Parted Lips
Open Mouth
Full Lips (丰唇效果)
Tongue Out
Eyes Closed
妆容/标记:
Eyeliner
Blush / Blushing
[color] lipstick
Lipgloss (亮泽)
Tattoo / Tattoo on [body part]
Freckles
眼睛颜色:
Blue Eyes
Green Eyes
Red Eyes
Pink Eyes
Purple Eyes
Orange Eyes
Yellow Eyes
Black Eyes
Brown Eyes
Grey Eyes
Amber Eyes
Hazel Eyes
Heterochromia
Glowing Eyes
表情:
Happy / Smiling
Sad
Neutral Expression
Serious Expression
Sexy Expression
Playful Expression
Angry
Surprised Expression / Shocked Expression
姿势:
Standing, Sitting, Kneeling, Squatting, Doggy Pose, Laying on Stomach, Laying on Side, Arm Support (倚靠手臂), Leaning Back, Handstand, Leg Split, Leg(s) Up (只想要一条腿用Leg,两条腿用Legs), Yoga Pose, Bent Over, Legs Spread, m-pose (仰卧,双腿张开膝盖上抬), Bent Knee
拟人化(兽人)/生物
要让模型同时表现真实生物或兽人,非常困难。我认为我现在做到了80%。Pony在拟人化方面表现很好,但在真实生物上就很差。如果你想要男性版本,建议使用标签male,但我训练的男性兽人数据不多,抱歉。
[Creature] = 仅生物
[Creature] Girl / Woman = 一个穿着该生物服装的女人。
[Creature] Girl / Woman, anthro / anthropomorphic = 变身为该生物(效果不一,可能完全变成兽人)
[Creature] Girl / Woman, furry = 嗯……一个兽人

我训练了大量生物,但效果不如我预期的稳健——所谓“稳健”,是指模型能泛化到未训练过的概念(Pony在这方面非常出色),所以效果可能因情况而异。
我还训练了非现实生物:
Slime Girl, Tieflings, Elves(包括暗精灵、夜精灵), Demons / Succubus, Fairies, Giantess, Monsters, Goblins, Orcs, Dwarves, Lamia(半蛇,搭配“半蛇半女”效果更佳), Oni, Robots, 可能还漏了一些...
PONY
目标
我非常喜欢SDXL Lightning模型的速度和画质。但我不喜欢SDXL将皮肤处理得过于“完美”,显得太塑料感。一个最佳的变通方法是用SDXL生成,再用ADetailer配合1.5模型处理脸部。我的目标是看看能否在不额外步骤或不切换模型的情况下,直接生成高质量脸部。本模型仅针对摄影,不适用于动漫或艺术,那些领域有更优模型。
PONY 版本2
我感觉上一版过度依赖高清修复,而忽略了普通图像质量。这次我已修正:你将看到前几个示例图均为普通质量。通过这项改进,高清修复(hi-res fix)的效果反而比以前更好(下方也有部分示例)。此外,这次我放宽了设置,以提供更大的自由度。市面上已有许多优秀的Pony模型,但它们似乎都不是TURBO模型。而我这个版本让你可以在“快速(4步)且质量尚可”与“常规速度(15+步)且高质量”之间自由选择。你甚至不需要长提示或所有评分提示,首个图像的提示已经是尽可能简洁的了。
设置
VAE: 内置
采样方法: LCM效果最佳。Euler A在某些设置下也可用,但不如LCM,因为皮肤纹理看起来有点假,但你可以尝试(似乎需要启用高清修复)。避免使用DPM。
调度类型: 选项更多了。在4步时,用DDIM或Karras。若超过10步,也可使用Beta和Normal;15步以上可添加SGM Uniform。
步数: 从4步开始。若想在不启用高清修复的情况下获得更丰富细节,可增加步数。
DDIM / 4+
Karras / 4+
SGM Uniform / 15+
Beta / 10+
Normal / 10+
CFG比例: 1 - 1.5。我本人最喜欢1.25,但你可以自由尝试,找到最适合你风格的数值。
其他: 其余设置与任何SDXL模型相同,如分辨率、lora、controlnet等。
PONY 版本 - DPM
有人要求为不能使用LCM的用户创建一个DPM版本。坦白说,我认为LCM生成效果更好,但我理解DPM更常用。
设置
VAE: 内置
采样方法: DPM++ SDE 或 DPM++ 2S a
调度类型: Karras 或 DDIM
步数: 4步。若需要可增至5步。
CFG比例: 1 - 1.5(以1为基准,若想提亮图像用1.2)
由于该模型设置与我的SDXL 4步版本一致,Lion图就是一个示例:先用SDXL模型生成,再用Pony DPM版本进行高清修复。
PONY 版本 - LCM
终于,我完成了Pony的LCM版本。SDXL虽然功能强大,但Pony在提示词和角色Lora上的灵活性更高。这就是为什么我每张展示图都使用角色Lora,来体现它的能力。我还另外上传了一些展示模型本身能力的图片。
设置
VAE: 内置
采样方法: LCM!这与其它模型不同,但能提供出色的皮肤细节,且速度极快。若无法使用LCM,Euler A可临时替代,但会产生更多伪影。
调度类型: Karras!再次与上一版不同。若你使用Euler A,可选用SGM Uniform或Beta(若你愿意冒险,想让色彩更暗淡,可选DDIM)。
步数: 4步。终于实现了真正的4步模型。
CFG比例: 1 - 1.2(以1为基准,若想提亮图像用1.2)
其他: 其他所有设置应与任何其他SDXL模型相同,例如分辨率、LoRA、ControlNet等。
高分辨率: 设置相同,使用LCM和Karras,但仅需4步。由于其速度非常快,我总是启用高分辨率修复并将去噪强度设为0.3。
混合: 我还喜欢做的另一件事是,将我的SDXL模型(如果有人感兴趣,我还制作了一个LCM版本)设为初始检查点,然后将高分辨率修复检查点设为Pony版本。效果非常好,我在第二组图片中上传了一个示例。
4步版本
有人要求提供一个4步模型,所以我制作了这个版本。我不能说它是真正的2.0版本,因为我不得不通过少量混合来稳定它,但我认为它比我的下一个版本更接近2.0,并且我在大多数生成中都努力改进它。下面有更多说明,但总结来说,虽然这个模型可以进行4步生成,但我发现5步能带来稍多一些的清晰度,不过你当然可以自行测试。
我不确定大家是否熟悉4步Lightening模型,因此下面是我的建议,这些设置不同于其他8步版本。我很想知道大家更喜欢哪个版本(是继续使用8步版本,还是直接切换到4步)。我发现8步在基础层面上确实能产生更锐利的结果,但减少步骤意味着更快的处理速度,且上采样效果非常好,确实能节省时间。我已包含一组基础图像、原生上采样图像(开箱即用),以及两个img2img上采样的示例。
我的设置
再次强调,欢迎自行实验,以下只是我的设置。
VAE: 内置
采样方法: 按我偏好排序:DPM++ 2S a、DPM++ SDE、DPM++ 2M SDE Heun、DPM++ SDE、DPM++ 2M。我不太喜欢Euler或Euler a,因为结果要么太模糊,要么太锐利,但你也可以自由尝试。
调度类型: SGM Uniform!
步数: 4-8,对我来说5步是最佳点。7-8步能提供更锐利的细节,但皮肤会开始显得不真实。
CFG尺度: 1 - 1.2(若想强烈推动可设为1.5,但超过后会出现伪影),建议直接保持1。
其他: 其他所有设置应与任何其他SDXL模型相同,例如分辨率、LoRA、ControlNet等。
img2img上采样 / 风格转换
我加入了两个上采样示例。我认为上采样常被误解,因为大多数优秀的上采样方法其实是为1.5模型设计的(如Ultimate SD上采样)。但我只是想展示两个使用Automatic1111的示例,我认为ComfyUI也能实现(虽然我没有包含这些)。
Ultimate SD上采样
第一个(赛博朋克女孩)是将图像放入img2img,然后使用Ultimate SD上采样。结果会因SDXL不兼容而有所差异,但如果你的基础图像能一次完成(而非平铺,平铺会在接缝处产生糟糕效果——我尝试过增加填充、遮罩模糊、半平铺、棋盘式等,但结果不一致),仍可获得不错的效果。设置为“仅调整大小”,采样方式同上。
提示词: 提示词无需复杂,即使只写“详细”也可能有效。
目标尺寸: 缩放到图像尺寸,但确保你的基础图像在标准SDXL输出尺寸范围内。
缩放比例: 1.25 - 1.5(更高会导致出现不良接缝)
上采样器: 使用你喜欢的,我喜欢4x_foolhardy_remacri、1x-ITF-SkinDiffDetail-Lite-v1,但开箱即用的R-ESRGAN 4x+也可以(不过皮肤可能略显虚假)。
平铺宽度: 设置为你图像的宽度,例如768x1280图像,就设为1280。
平铺高度: 我保持为0,但也可以设为与图像一致或符合其他一致的SDXL设置。
去噪强度: 0.2-0.6,取决于图像类型。这里有两个目标:你是想上采样图像,还是想将图像风格改为本模型?如果只是提升分辨率或尺寸,保持低去噪值。数值越低,改变越少。通常我从0.3开始,但0.5效果也不错。
遮罩模糊: 8、16
填充: 32、64、128
开箱即用,SD上采样 / ControlNet
(海滩女孩)我更倾向这种方法,因为它似乎能提供更一致的结果,但需要分阶段进行上采样(而Ultimate SD会自动完成这些阶段)。这让你对每一步都有更多控制。只需在img2img标签页的脚本中选择SD上采样。设置为“仅调整大小”,采样方式同上。
提示词: 如上所述,若使用低去噪值,“详细”即可;若提高去噪值,建议先用Interrogate CLIP分析图像生成类似提示词。
平铺重叠: 128
缩放因子: 1.25 - 2
上采样器: 同上
去噪强度: 同上。我喜欢分阶段上采样,所以我会从低值开始,逐步改变图像——如果是动漫图像,可能需要2-3次;如果是已具写实风格的图像,可能只需1次。
ControlNet: 使用ControlNet能获得更好效果,可使用基础的OpenPose,Depth和Canny也有效。请确保使用SDXL版本模型。我保持默认设置。
若你的目标是改变风格并进行多次迭代,每次迭代后需将图像重新缩小回原始尺寸,可通过外部工具或使用“调整大小”(仅调整大小(潜在上采样))实现。
8步版本
模型
我从我的自定义1.5模型中创建了一个约400张高质量图像的数据集,然后将其转化为LoRA风格,再混合回一个由以下两个模型混合而成的模型中。结果是:皮肤纹理更具质感,包含更多瑕疵、裂纹、毛孔和细节。
RealVisXL V4.0 - V4.0 Lightning (BakedVAE) | Stable Diffusion Checkpoint | Civitai
Pixel Alchemy - H v2.0 | Stable Diffusion Checkpoint | Civitai
照片示例
我不擅长编写优质提示词,因此许多提示词来自他人,或由随机提示词生成器生成。我也加入了一些基础提示词,以表明某些提示词的冗长并不必要,即便简单的提示词也能生成高质量图像。
与大多数SDXL模型一样,在正面提示中加入score_9、score_8_up、score_7_up、score_8,在负面提示中加入score_1、score_2、score_3、score_4、score_5、score_6的组合,可提升图像质量。
我的设置
欢迎自行寻找最佳设置,以下只是我的设定。
VAE: 内置
采样方法: DPM++ SDE 或 DPM++ 2S a
调度类型: Karras
采样步数: 8
图像尺寸: 1024x1024、768x1280、832x1216
CFG尺度: 1-3(2通常是最佳点)
Clip跳过: 1-2(我知道多数SDXL模型设为2,你可以这么做,但因为本模型专注于摄影,影响不大)。
高分辨率
上采样器: 任选,我喜欢4x_NMKD-Siax_200k
高分辨率步数: 8
去噪强度: 0.3-0.6
高分辨率CFG尺度: 2
放大倍数: 1.5




















