Spider Gwen / Gwen Stacy
详情
下载文件
关于此版本
模型描述
该模型旨在帮助生成鲜艳的插画/类3D风格的蜘蛛格温/格温·斯黛西图像。
使用“Gwen Stacy”一词更可能生成未戴面具的角色,而使用“Spider Gwen”则更可能生成戴面具的角色。如果你想要生成完全不穿服装的角色,请不要使用上述两个词,而只需描述服装本身,不要提及“谁”。
版本1.1更偏向于清晰、对比强烈、视觉冲击力强的插画风格,减少了3D效果,不过使用较低权重仍可实现后者。
我通常会将Chroma作为LoRA的目标阶段,从中生成数据集,最终目标是Z-Image;但有时我也会选择Illustrious作为目标,尤其是在完全从该阶段提取数据集时。在此案例中,我选择了Illustrious的精炼版本。
当我发布此LoRA时,我还不知道我用于数据集的Illustrious模型的来源,但现在这个问题已经解决。尽管我仍保留了上传的版本,但我已标注了原始资源以示致谢,请参见资源中的iLustMix(v3)。此外,该混合模型还有其他版本,我正在测试其中几个,尽管v9呈现出非常不同的风格,但我还挺喜欢的。
每当我测试Danbooru或e621的触发词集合以寻找有趣的角色、服装或动作时,我都会首先参考这个被标记为“iLustMix”并现已列入资源的模型,确保它在Illustrious中,以免抓狂。
选择一组主题图像来生成Illustrious LoRA,帮助我将结果导向目标。随后,我使用Illustrious生成图像用于Z-Image目标,共使用了218张。通过随机种子生成自然的动作姿态,再手动添加明确的姿态、面部表情、朝向、戴面具与不戴面具的版本,并提供丰富的服装多样性,这应能为你的创意探索提供足够扎实的基础。
图像随后被裁剪以聚焦主体,并清除所有残留伪影。我训练了三组,每组20个周期,每组训练步数略超6000步,使用了不同的rank和alpha值,最终选定32/1以获得更优细节。基于此,我生成了数千张图像以评估灵活性,随后回到起点,将图像从174张增加到218张,最终训练至33个周期,共7194步。请注意,训练器(OneTrainer)使用从零开始的索引,因此最终显示的7193实际对应7194步。
信息太多?那你为什么还继续读?:P~
格温·斯黛西首次出现在媒体中是1965年12月出版的漫威漫画《神奇的蜘蛛侠》第31期。了解这一点很有趣,因为我一直是蜘蛛侠粉丝,却直到《蜘蛛侠:平行宇宙》上映后才认识格温——接下来我就会提到这部影片。
本LoRA所塑造的角色旨在重现该虚构人物在《蜘蛛侠:纵横宇宙》发布前的美学风格,但融入了更现代的审美与3D光泽。
要生成视觉冲击力强的图像,你需要添加大量细节,甚至描述那些对你而言显而易见的元素,详细说明其颜色、质感与触感。
我常使用训练时所用的标注来还原原始图像的精髓,但这一次图像均为手动提示生成。因此,我从网络上收集了大量不同动作与场景中的蜘蛛格温(斯黛西)图像,然后使用joy-captioning工具生成详细的描述,再根据需要调整这些标注,以生成示例提示。
v1.1将训练步数推进至10027步,从同一批图像中筛选出精炼集,以引导模型更偏向插画风格而非3D风格。




















