TwinkCockFlux_alpha

详情

模型描述

TwinkCockFlux (alpha43000)

这是我第三次公开发布的LoRA。这是我对如何使用大型语言模型(LLM)生成有效LoRA的持续学习成果。

此版本训练至43000步。在此步数时,LoRA有时无法生成阴茎,或会略微模糊。建议使用批量生成。超过此步数后,LoRA开始过训练,有时会失去提示遵循性、增加幻觉,或使阴茎渲染得过于夸张,丧失审美吸引力。

这是一个基于Flux_1.dev模型生成阴茎的概念型LoRA。本LoRA的目标是:

  • 生成包皮环切后的阴茎

  • 生成包皮环切后的阴茎与衣物互动的场景

  • 测试在同一张图像上使用类别迥异的标签的可行性

我将其视为alpha版本,因为与TwinkCockXL一样,它大多数时候有效,但尚未完美。

此LoRA基于TwinkCockXL的基础图像集进行训练,但新增了以下显著内容:

  • 更多亚洲、黑人和拉丁裔年轻男性的表现,以及“后少年”阶段的男性。尽管大部分图像仍为白人少年,但此LoRA相较于TwinkCockXL更具上下文依赖性,对年龄的敏感度更低。

    • 补充说明:进一步测试发现,发色与光照似乎与非白人生成存在交互作用。除黑色或棕色外的发色可能导致生成偏离亚洲、黑人或拉丁裔角色。极端低光照可能导致LoRA混淆黑人与南亚裔生成。添加“他头顶上方有一束柔和的白光”可能解决该问题。
  • 采用不同标签策略以突破Stable Diffusion的70个标签词限制,每张图像采用三种不同标签方式:

    • 阴茎:描述阴茎(人种、勃起状态、尺寸、与衣物的特殊互动)

      • {white, black, latino, asian};{flaccid, semi-erect, erect};{small-sized, average-sized, large-sized}
    • 引导:描述照片中的主要人物(人种、体型、发色与发型、服装)

    • 通用:总体描述照片(拍摄描述、镜头角度、拍摄年代、使用的相机类型、光影与色调)

  • 新增“飞溅精液”作为“魔法时刻”的实验性概念。

主激活标签“twinkcockFlux”被添加至所有图像中。以下子概念额外添加了二级标签(单字标签与自然语言短语):

  • "cutbetweenpantsandshirtFlux", "his penis is between his pants and shirt" — 穿着上衣和下装(裤子、短裤、内裤)的男性,阴茎从衣物缝隙中露出。

  • "cutcockthruflyFlux", "his dick is poking through his fly", "his penis is poking through his fly" — 阴茎从裤子前襟开口处露出的男性。

  • "cutcockthrulegholeFlux", "his penis is slipping out of his leghole", "his penis is poking out of his leghole" — 阴茎从下装腿口露出的男性(表现不稳定,需明确指定为短裤)。

  • "cutnopantsFlux", "he is not wearing pants" — 穿着上衣但未穿裤子、阴茎可见的男性。

  • "cutnoshirtFlux", "he is not wearing a shirt" — 穿着下装但未穿上衣、阴茎可见的男性。

  • "cutfullynudeFlux", "he is fully nude" — 完全赤裸、阴茎可见的男性。

  • "cutflyingcumFlux", "He is holding his erect penis and having an orgasm",以及"he is holding his erect penis, he is having an orgasm, he is jerking off, he is cumming, he is masturbating" — 在“魔法时刻”进行射精的男性。

若追求随机性,则无需使用二级标签。若希望生成特定子概念,与TwinkCockXL不同,Flux在同时添加单字二级标签与自然语言短语后,提示遵循性显著提升。二级标签之间不应相互矛盾,以确保生成一致性。

cutflyingcumFlux数据集与其他二级概念交叉标注,有时即使未明确指定,也会生成“意外射精”效果。我对这究竟是LoRA的缺陷还是特性尚存犹豫。由于该子概念的源图像多为坐着或手持阴茎的姿势,因此相关提示更易触发该效果。此二级概念为实验性,表现不稳定,建议强度设为1.2。

采样器、调度器、Clip说明:

  • 初步测试使用Comfy-UI及自定义工作流。在本帖样本生成后期发现,ForgeUI生成结果比Comfy-UI工作流更稳定,可能与Comfy-UI的工作流编程方式有关。

  • 推荐引导系数范围为2.8至3.5。使用ForgeUI生成本帖样本时,2.8会生成更真实的光影与对比度,但倾向于模糊的阴茎;3.5则整体图像更锐利,但会出现类似高动态范围图像(HDRI)的过度对比。

  • 采样器方面,heun、euler、ipndm、deis结果相近,其中heun和deis为首选。Comfy-UI中的dpm_adaptive从相同种子生成的结果与其他采样器差异明显,建议同时生成多个样本(如XY绘图)。在ForgeUI中使用dpm_adaptive未能成功。

  • Beta采样器表现最稳定。

  • 38-58步数最为稳定,但取决于采样器与其他设置。

  • 测试中扰动注意力引导设置为2.60–2.95。

  • 最大偏移设为1.15,基础偏移设为0.5。

  • 受硬件限制,本LoRA的大部分测试使用了flux1-dev-Q5_K_S模型。

  • 建议使用原始Clip-L模型。使用其他微调的Clip模型会导致质量明显下降、幻觉增加、提示遵循性降低。

其他说明:

  • 与TwinkCockXL不同,TwinkCockFlux未专门训练年龄范围。

  • 与TwinkCockXL类似,TwinkCockFlux已包含足够数量的“他戴着项链”、“他戴着AirPods”、“阳光洒在他身上”、“他戴着棒球帽”等概念,可稳定生成。

  • 增加了照片拍摄年代的描述(如“1970年代拍摄”、“2020年代拍摄”)。这意外导致数字照片质量被降低至对应年代水平(如2000年代初低分辨率数码相机、模糊增强)。若出现模糊,建议明确指定“2020年代拍摄”或“2020年代拍摄”。

  • 由于训练初期数据受限,图像未对人脸或背景进行遮罩。此LoRA会影响人脸生成,并与其他LoRA交互。

  • 训练数据中未包含女性,我不清楚若指定女性会发生什么,可能的结果是为任何人物添加阴茎。由于缺乏相关源图像,我无意在未来加入女性。

  • 数据集中未包含无可见阴茎的臀部图像。

  • 数据集包含少量多人图像,但数量不足,无法稳定生成高质量多人图像。

  • 使用了正则化图像,但占比极低。尚未对超越写实风格的多样性进行广泛测试。

本LoRA共使用约14,800张图像(含重复与翻转),分辨率均为1024x1024。重复图像用于平衡各二级概念的数量,使其大致均等呈现。

特别感谢@markury、@spiritparticle、@wolffur666456以及Bulge Discord服务器成员 https://thebulge.xyz 的支持、建议与Beta测试。

此模型生成的图像

未找到图像。