Chef's Astral Vision v0.6
详情
下载文件
关于此版本
模型描述
问候各位厨师!
点击下方的“显示更多”以阅读使用此模型的完整指南和技巧。
我是 Promptnanimous,而“厨师的星界视野”是我的第三个混合模型。
该模型基于我之前的模型 厨师的腌制胸肉 混合而成。“厨师的星界视野”是一个半写实的“2.8D”模型,融合了写实构图与某些非写实细节。
如果你喜欢我的指南和模型,请考虑关注我、与朋友分享此模型,并为我购买一杯 ko-fi。未来我将发布更多模型、指南和示例图像!
厨师的星界视野示例
大部分展示图片均使用 txt2img 和高分辨率修复(hires. fix)生成,未使用 Lora 或负面嵌入。部分图片使用了 Lora 和负面嵌入,以赋予特定提示额外风格或控制某些细节,帮助你了解如何将结果推向不同方向。总体而言,该模型在不使用嵌入的情况下表现相当出色,但你可以通过精选负面嵌入来增强提示效果。实验是你的朋友!
以下是基于我观察得出的该模型特性。你可能会发现它表现得比这里列出的更好或更差,无论如何,欢迎告诉我,以便我学习并调整!
优势:
半写实性 —— 在未明确提示特定风格(如“照片级写实、绘图”等)的情况下,该模型具有轻微的半写实感,强烈偏向于照片级构图,带来整洁且近乎令人愉悦的诡异谷效应。
美丽的女性形象
风格融合
色彩
时间段(昼夜)
静物
抽象细节 —— 尽管高度偏向写实,但仍能生成一些非常酷的“未驯服”细节。请查看展示图片中使用 BREAK 和各种风格提示的示例。
表现尚可:
照片级写实 —— 你可以使用如 epiCRealLife Enhancer Lora 推向这个方向。虽然有其他模型在照片级写实方面更优秀,但本模型也能生成良好效果。
Danbooru 标记
绘画与插画 —— 对某些提示(如我个人认为的黑白漫画)能给出极佳结果,但对纯动漫或插画提示会抗拒完全转为 2D。不过这也有额外好处:能实现半写实与风格混搭的有趣效果。
画家风格 —— 你可以通过使用 BREAK 标记后跟你想影响的画家名称,来尝试融合不同艺术家风格。
复古动漫(我使用“1990年代动漫”作为提示,效果良好)
姿势(可始终使用 ControlNet 获得更佳结果)
NSFW 行为(你可能需要使用专业 Lora 或嵌入,但效果因人而异)
弱点:
手部 —— 天啊,这模型生成的手部太糟糕了 :( 我的下一版本将尝试训练以消除这些缺陷。
- (你可以先找一个你喜欢的提示,然后加入 好手部 Beta Lycoris)
持物能力
如果你难以获得与我相似的结果,请尝试以下方法:
确保你的设置与图像元数据中的设置完全一致,包括 VAE、Clip Skip、放大器、去噪强度和标记组合设置。
确保未意外启用任何额外扩展/插件,如 ControlNet 未激活等。
如果你希望在更改某些细节(如场景或角色)时保留“风格”,请尽量不要大幅改变提示标记的顺序。通过最小化编辑,你仍可保留风格,同时改变角色和场景细节,获得相似效果。
如果主要差异在于面部,可能我使用了 adetailer,请确保启用它(如尚未安装,请先安装),并复制图像元数据中的额外 adetailer 设置。
注意我使用了 xformers,这意味着即使使用相同种子,我的生成结果在某些细微处也具有非确定性。若你的图像仅在极小细节上存在差异,这便是原因。这是 xformers 的固有特性,无法改变。
若上述方法均无效,请私信我,我会尽力协助。
常用生成设置
请以示例图像为参考,复现特定效果。若你一般性探索模型,可使用以下生成设置,并按需调整。
为在速度与质量之间取得良好平衡,我使用以下设置快速迭代新提示:
- VAE:vae-ft-mse-840000-ema-pruned.safetensors
- Clip Skip:1
- 采样器:UniPC 或 DPM++ 2M Karras
- 步数:35 - 40
- 高度:512
- 宽度:768
- CFG:6 至 8 之间
- 高分辨率修复:是(如需更快速度,可选“否”以牺牲细节清晰度)
- 高分辨率步数:20 或 25
- 去噪强度:0.45 - 0.55(取决于我有多急躁 —— 设得更低可稍快)
- 放大倍数:1.5
- 放大器:Latent(双三次抗锯齿) 或 4x_fatal_anime_500000_G 或 4x_foolhardy_Remacri 或 4x-UltraSharp
追求极致质量,但速度较慢(有时我在以上设置产出一批不错结果后使用):
- VAE:vae-ft-mse-840000-ema-pruned.safetensors
- Clip Skip:1
- 采样器:DPM++ SDE Karras
- 步数:25
- 高度:512
- 宽度:768
- CFG:6 至 8 之间(部分提示可更高以获得惊艳效果,且无不良伪影)
- 高分辨率修复:是
- 高分辨率步数:20
- 去噪强度:0.45 - 0.55(接近 0.45 更“柔和”,0.55 更“锐利”)
- 放大倍数:2
- 放大器:Latent(双三次抗锯齿) 或 4x_fatal_anime_500000_G 或 4x_foolhardy_Remacri 或 4x-UltraSharp
随机小贴士
如前所述,我会在迭代与批量生成高质量图像时使用不同设置。速度与质量需权衡。缓慢实验不可取,但若我能预估超过 50% 的结果符合预期,我愿意等待批量生成。
我有时会加入 好手部 Beta Lycoris,有时也会加入 细节调节 Lora,视情况而定。由于 Lora 会减慢生成速度,我通常在迭代时不使用它们,除非专门测试某 Lora 的能力。
对于本模型,负面嵌入通常并非必要,但我经常使用它们,它们能产生非常出色的效果。当追求人物照片级写实时,我喜欢将 CyberRealistic Negative 与 SkinPerfection Negative v1.5 结合使用。我还常使用多种其他负面嵌入组合,包括 verybadimagenegative v1.3、bad-hands-5、aid28、badv5、deformityv6、bad_pictures、bad-picture-chill-75v,可能还有几个我遗漏的。
如果你看到某些负面嵌入包含字符 “en_”,它们属于一套尚未发布的自定义负面嵌入。若需求足够,我会尝试说服创作者发布,或代为发布。
使用 (worst quality:1.5), (low quality:1.5), (normal quality:1.5) 通常能提升生成效果。
在负面提示中使用 “greyscale” 并调整注意力,可控制色彩。
在负面提示中使用 “symmetry” 可获得更有趣的结果,我偏好将注意力设为 1.3。
在正面或负面提示中使用 “plump” 可控制主体的体型权重。
如需“牛仔镜头”,但结果太近,请在正面提示中加入 “hips”。 “cowboy” 是一个“污染”标记,会引入牛仔风格的细节(如牛仔裤、帽子等),请勿使用。其他许多模型亦同理。
若希望画面包含完整主体,请在正面提示开头加入 “full body”。
面部特征 —— 如果你生成的面部都长得一模一样,很可能你无意中使用了一个或多个影响面部的标记。除花费大量时间排查“锁定”面部特征的标记并用提示编辑延迟这些标记(如 [token:0.3])外,你无法做太多。
上述情况同样适用于 Lora(但提示编辑部分不适用)。有时 Lora 会对其本意之外的其他生成方面产生影响。若你生成的结果出现了非预期的特性,而负面提示无法改善,那可能是你所用的 Lora 的问题。根据 Lora 类型,你可能无法“修复”这些不想要的特征。
尽量减少提示中的标记数量。这不是强制要求,但有助于提升稳定性。你当然也能用大量标记获得精彩效果,但平衡更困难,且由于提示被以 75 标记为一组送入 U-Net,标记越多,结果越可能异常且不可预测地变化。
关于我
我已每日使用 Stable Diffusion v1.5 模型与 Automatic1111 约 14 个月,期间生成超过 60,000 张图片,并通过快速迭代尽可能学习提示技巧与设置。
我的专长是仅使用 txt2img 和高分辨率修复(hires. fix),不依赖 img2img 或修图(inpainting)等技术,以从 SD1.5 模型中榨取最佳效果。我享受通过寻找优质设置,实现简洁高效地生成高质量图像的过程。我也尽量避免使用 Lora,因其会拖慢生成速度,但我会在追求特定风格或使用修复型 Lora(如好手部 Beta 和细节调节)时使用它们。
如果你喜欢我的指南和模型,请考虑关注我、分享模型给朋友,并为我购买一杯 ko-fi。
未来我将继续发布更多模型、指南和样本图像!




















