Chef's Astral Vision v0.6

详情

下载文件

模型描述

问候各位厨师!

点击下方的“显示更多”以阅读使用此模型的完整指南和技巧。

我是 Promptnanimous,而“厨师的星界视野”是我的第三个混合模型。

该模型基于我之前的模型 厨师的腌制胸肉 混合而成。“厨师的星界视野”是一个半写实的“2.8D”模型,融合了写实构图与某些非写实细节。

如果你喜欢我的指南和模型,请考虑关注我、与朋友分享此模型,并为我购买一杯 ko-fi。未来我将发布更多模型、指南和示例图像!

厨师的星界视野示例

大部分展示图片均使用 txt2img 和高分辨率修复(hires. fix)生成,未使用 Lora 或负面嵌入。部分图片使用了 Lora 和负面嵌入,以赋予特定提示额外风格或控制某些细节,帮助你了解如何将结果推向不同方向。总体而言,该模型在不使用嵌入的情况下表现相当出色,但你可以通过精选负面嵌入来增强提示效果。实验是你的朋友!

以下是基于我观察得出的该模型特性。你可能会发现它表现得比这里列出的更好或更差,无论如何,欢迎告诉我,以便我学习并调整!

优势

  • 半写实性 —— 在未明确提示特定风格(如“照片级写实、绘图”等)的情况下,该模型具有轻微的半写实感,强烈偏向于照片级构图,带来整洁且近乎令人愉悦的诡异谷效应。

  • 美丽的女性形象

  • 风格融合

  • 色彩

  • 时间段(昼夜)

  • 静物

  • 抽象细节 —— 尽管高度偏向写实,但仍能生成一些非常酷的“未驯服”细节。请查看展示图片中使用 BREAK 和各种风格提示的示例。

表现尚可

  • 照片级写实 —— 你可以使用如 epiCRealLife Enhancer Lora 推向这个方向。虽然有其他模型在照片级写实方面更优秀,但本模型也能生成良好效果。

  • Danbooru 标记

  • 绘画与插画 —— 对某些提示(如我个人认为的黑白漫画)能给出极佳结果,但对纯动漫或插画提示会抗拒完全转为 2D。不过这也有额外好处:能实现半写实与风格混搭的有趣效果。

  • 画家风格 —— 你可以通过使用 BREAK 标记后跟你想影响的画家名称,来尝试融合不同艺术家风格。

  • 复古动漫(我使用“1990年代动漫”作为提示,效果良好)

  • 姿势(可始终使用 ControlNet 获得更佳结果)

  • NSFW 行为(你可能需要使用专业 Lora 或嵌入,但效果因人而异)

弱点

  • 手部 —— 天啊,这模型生成的手部太糟糕了 :( 我的下一版本将尝试训练以消除这些缺陷。

  • 持物能力

如果你难以获得与我相似的结果,请尝试以下方法

  1. 确保你的设置与图像元数据中的设置完全一致,包括 VAE、Clip Skip、放大器、去噪强度和标记组合设置。

  2. 确保未意外启用任何额外扩展/插件,如 ControlNet 未激活等。

  3. 如果你希望在更改某些细节(如场景或角色)时保留“风格”,请尽量不要大幅改变提示标记的顺序。通过最小化编辑,你仍可保留风格,同时改变角色和场景细节,获得相似效果。

  4. 如果主要差异在于面部,可能我使用了 adetailer,请确保启用它(如尚未安装,请先安装),并复制图像元数据中的额外 adetailer 设置。

  5. 注意我使用了 xformers,这意味着即使使用相同种子,我的生成结果在某些细微处也具有非确定性。若你的图像仅在极小细节上存在差异,这便是原因。这是 xformers 的固有特性,无法改变。

  6. 若上述方法均无效,请私信我,我会尽力协助。

常用生成设置

请以示例图像为参考,复现特定效果。若你一般性探索模型,可使用以下生成设置,并按需调整。

为在速度与质量之间取得良好平衡,我使用以下设置快速迭代新提示:

  • VAE:vae-ft-mse-840000-ema-pruned.safetensors
  • Clip Skip:1
  • 采样器:UniPC 或 DPM++ 2M Karras
  • 步数:35 - 40
  • 高度:512
  • 宽度:768
  • CFG:6 至 8 之间
  • 高分辨率修复:是(如需更快速度,可选“否”以牺牲细节清晰度)
  • 高分辨率步数:20 或 25
  • 去噪强度:0.45 - 0.55(取决于我有多急躁 —— 设得更低可稍快)
  • 放大倍数:1.5
  • 放大器:Latent(双三次抗锯齿) 或 4x_fatal_anime_500000_G 或 4x_foolhardy_Remacri 或 4x-UltraSharp

追求极致质量,但速度较慢(有时我在以上设置产出一批不错结果后使用):

  • VAE:vae-ft-mse-840000-ema-pruned.safetensors
  • Clip Skip:1
  • 采样器:DPM++ SDE Karras
  • 步数:25
  • 高度:512
  • 宽度:768
  • CFG:6 至 8 之间(部分提示可更高以获得惊艳效果,且无不良伪影)
  • 高分辨率修复:是
  • 高分辨率步数:20
  • 去噪强度:0.45 - 0.55(接近 0.45 更“柔和”,0.55 更“锐利”)
  • 放大倍数:2
  • 放大器:Latent(双三次抗锯齿) 或 4x_fatal_anime_500000_G 或 4x_foolhardy_Remacri 或 4x-UltraSharp

随机小贴士

如前所述,我会在迭代与批量生成高质量图像时使用不同设置。速度与质量需权衡。缓慢实验不可取,但若我能预估超过 50% 的结果符合预期,我愿意等待批量生成。

我有时会加入 好手部 Beta Lycoris,有时也会加入 细节调节 Lora,视情况而定。由于 Lora 会减慢生成速度,我通常在迭代时不使用它们,除非专门测试某 Lora 的能力。

对于本模型,负面嵌入通常并非必要,但我经常使用它们,它们能产生非常出色的效果。当追求人物照片级写实时,我喜欢将 CyberRealistic NegativeSkinPerfection Negative v1.5 结合使用。我还常使用多种其他负面嵌入组合,包括 verybadimagenegative v1.3bad-hands-5aid28badv5deformityv6bad_picturesbad-picture-chill-75v,可能还有几个我遗漏的。

如果你看到某些负面嵌入包含字符 “en_”,它们属于一套尚未发布的自定义负面嵌入。若需求足够,我会尝试说服创作者发布,或代为发布。

使用 (worst quality:1.5), (low quality:1.5), (normal quality:1.5) 通常能提升生成效果。

在负面提示中使用 “greyscale” 并调整注意力,可控制色彩。

在负面提示中使用 “symmetry” 可获得更有趣的结果,我偏好将注意力设为 1.3。

在正面或负面提示中使用 “plump” 可控制主体的体型权重。

如需“牛仔镜头”,但结果太近,请在正面提示中加入 “hips”。 “cowboy” 是一个“污染”标记,会引入牛仔风格的细节(如牛仔裤、帽子等),请勿使用。其他许多模型亦同理。

若希望画面包含完整主体,请在正面提示开头加入 “full body”。

面部特征 —— 如果你生成的面部都长得一模一样,很可能你无意中使用了一个或多个影响面部的标记。除花费大量时间排查“锁定”面部特征的标记并用提示编辑延迟这些标记(如 [token:0.3])外,你无法做太多。

上述情况同样适用于 Lora(但提示编辑部分不适用)。有时 Lora 会对其本意之外的其他生成方面产生影响。若你生成的结果出现了非预期的特性,而负面提示无法改善,那可能是你所用的 Lora 的问题。根据 Lora 类型,你可能无法“修复”这些不想要的特征。

尽量减少提示中的标记数量。这不是强制要求,但有助于提升稳定性。你当然也能用大量标记获得精彩效果,但平衡更困难,且由于提示被以 75 标记为一组送入 U-Net,标记越多,结果越可能异常且不可预测地变化。

关于我

我已每日使用 Stable Diffusion v1.5 模型与 Automatic1111 约 14 个月,期间生成超过 60,000 张图片,并通过快速迭代尽可能学习提示技巧与设置。

我的专长是仅使用 txt2img 和高分辨率修复(hires. fix),不依赖 img2img 或修图(inpainting)等技术,以从 SD1.5 模型中榨取最佳效果。我享受通过寻找优质设置,实现简洁高效地生成高质量图像的过程。我也尽量避免使用 Lora,因其会拖慢生成速度,但我会在追求特定风格或使用修复型 Lora(如好手部 Beta 和细节调节)时使用它们。

如果你喜欢我的指南和模型,请考虑关注我、分享模型给朋友,并为我购买一杯 ko-fi

未来我将继续发布更多模型、指南和样本图像!

请发布你的作品!我非常乐于学习哪些有效、哪些无效!

此模型生成的图像

未找到图像。