Helltaker Style Illustrious
详情
下载文件
模型描述
起始提示词:(质量与风格提示词)
masterpiece, best quality, amazing quality, flat_color, sharp, (2d, cartoon, toon \(style\):1.2),
(shiny, bloom, glossy, vibrant, edge lighting, volumetric lighting, rim lighting),
风格提示词/Lora模型权重:0.7 - 0.8 效果最佳
<lora:Offical_Helltaker_Style:0.8>, helltaker_style
[在此处添加您的自定义提示词]。
我使用角色提示词,因此将它们放在底部,任何动作、服装或背景则放在中间。
创作者说明:
我注意到,许多人在训练某种风格时,仍然为图像添加详细标签。其实你无需这样做。你可以使用一个激活提示词,或者干脆跳过它,完全避免使用激活标签。
当你训练一种风格时,你并不是在训练概念(如姿势、角色、服装等)。概念依赖于UNet和文本编码器两者。而风格则仅依赖于UNet,负责处理图案和色彩识别。
文本编码器的作用是将你在训练时分配给图像的标签与图像内容关联起来,帮助模型理解每张图像中包含什么。但风格训练并不需要这个,因为风格纯粹是视觉层面的——你不需要告诉模型图像中有哪些对象或主体。此外,风格影响的是整张图像,而非局部。
***然而,如果你正常标注图像——例如添加“1boy”、“1girl”或图像中的每一个细节——模型就会开始将这些标签与风格本身关联起来。在推理阶段,当你在提示词中使用这些标签时,模型可能会优先生成与这些标签相关的内容(例如男孩或女孩),并将其与风格叠加,即使你原本只想捕捉视觉美学。这会污染训练过程,将概念学习混入本应纯粹聚焦于风格的训练中。若不使用这些标签,风格将更具灵活性,可广泛适用于任何主体。
需要注意的是,某些角色模型确实会影响图像风格,这是因为它们在训练时同时利用了UNet和文本编码器。
***示例:
假设有人训练了一个成人漫画创作者的风格,而该数据集中多次出现“传教士姿势”,且被正常标注了。那么当其他人使用这个风格模型时,只要生成“传教士姿势”,模型就会复现数据集中那个特定角度和样式的传教士姿势。这是因为数据集被正常标注了,破坏了风格模型的灵活性,导致使用者只能产出相同的姿势和视角。






