YOUR Penis (Retracted) 🍌 by Huggy

详情

模型描述

💡 在 Civitai 上搜索 “huggy” 以查找我所有的模型。

💡 此 LoRA 仅生成包皮回缩的图像。包皮过紧版本计划今年晚些时候推出。

🍌 参与下一个 LoRA 的制作(👮 继续阅读)

😫 自 4.3 更新以来已经过去七个月了(那次更新过度拟合严重)。按理说,我应该已经利用之后学到的训练方法训练出一个修复版本,但目前我仅有 200 张样本,数量仍不足。

🙅 网络上的随机自拍并不能作为有效的训练数据——它们更多体现的是虚荣,而非自然解剖结构。合适的训练数据应拍摄于自然日光下,构图范围从肚脐下方至膝盖上方。

🙏 我一直在请求 Civitai 上的兄弟们捐赠照片,这让我觉得自己有点疯狂,但这是建立一个合格数据集的唯一途径。请通过 Civitai 私信 @huggy。

对于特定类型的阴毛,单个人的完整图像集应包含共计 160 张图片(16 种状态 × 2 种姿势 × 5 个角度)。

🍌 16 种状态(4 × 4)

  • 收缩状态(阴囊下垂且紧致)(包皮后缩、部分覆盖)

  • 自然疲软状态(阴囊下垂且紧致)(包皮后缩、部分覆盖)

  • 半勃起状态(阴囊下垂且紧致)(包皮后缩、部分覆盖)

  • 勃起状态(阴囊下垂且紧致)(包皮后缩、部分覆盖)

🍌 2 种姿势 & 5 个角度

  • 站立:第一人称视角(从上方拍摄,避开脚部)、俯视(从下往上)、正面、侧面

  • 蹲下:第一人称视角(从上方拍摄,避开脚部)、正面、侧面、俯视(从下往上)、背面(从后方)

🍌 4 种阴毛类型

  • 剃光

  • 修剪

  • 自然

  • 湿润

🍌 人种

  • 非裔

  • 拉丁裔

  • 亚裔

  • 高加索裔

🍌 提交方式

将你的照片打包成 ZIP 文件,上传至以下任一存储平台,并通过 Civitai 私信 @huggy 发送链接:


🍌 提示词污染(Prompt Bleed):

在为训练数据撰写标题时,需警惕提示词污染。一个经典例子是训练一种几维鸟的 LoRA:使用触发词 “kiwi bird” 看似自然,但模型对 “kiwi fruit”(猕猴桃)的关联太强,会导致生成结果出现鸟与水果的混合体。改用带下划线的独特触发词如 “kiwi_bird” 可解决此问题。

另一个案例是使用 “curtain wall” 作为低多边形风格的 LoRA 触发词,结果常生成带窗帘的墙。相比之下,使用简单描述如 “a giant window from ceiling to floor” 更为稳妥。

这表明,在不引发混淆的前提下,用 LoRA 教授基础模型新概念非常困难,有些模型更容易被误导。一个良好的方法是先在不同模型上测试标题作为提示词的效果。如果即使不使用 LoRA 就已出现提示词污染,最好改用同义词。例如,使用提示词 “red lighting” 时,许多插画模型会生成皮肤发红的角色,而非红色灯光——这种问题似乎只在“红色”上特别突出。

这使得训练阴茎模型的项目变得极具挑战性。你面对的是 16 种状态(4×2×2),因此更简单的方法是将每种状态作为独立 LoRA 训练,并使用独特的触发词以避免污染。仅就阴茎茎干而言,就有“收缩”(如洗完冷水澡后)、“自然疲软”、“半勃起”和“勃起”四种状态。阴囊则可能是“极度下垂”或“紧致”;包皮可能是“后缩”或“部分覆盖”。这就是 4×2×2 共 16 种初始状态的来源。

此外,还有 4 种阴毛类型(剃光、修剪、自然、湿润)和 4 种主要人种,它们都需要子类区分。在标题中反复使用 “penis” 一词将是灾难性的。使用多个独特触发词可能是唯一可行的解决方案。


🍌 版本 4.4 — 滞后更新:

  1. 为平衡风格保真度与泛化能力,将进行以下调整:
  • 使用 26–81 个 epochs 以防止过度记忆。

  • 降低 Num repeats 至 3。

  • 启用随机标题(Shuffle Captions)。

  • 将 UNet 学习率降低至 0.00025–0.0003,以实现更稳定的训练。

  • 将 Text Encoder 学习率从 0.00005 提高至 0.000075 和 0.0001,以增强文本编码器的影响,同时保持平衡。

  • 降低 Min SNR Gamma(从 5 → 2-3),以减少过度锐化。

  • 调整 Network Dim 至 48,Network Alpha 至 32,以避免捕捉过多细节。

  • 启用翻转增强(Flip Augmentation)以提升泛化能力。

  • 降低噪声偏移至 0.06–0.08,以最小化伪影。

  • 将学习率调度器切换为 “cosine”,以实现更平滑的学习进程。

  1. 将训练数据集扩充至 ??? 张照片,提升多样性。

  2. 使用多个触发词以防止提示词污染。

  3. 可能将此 LoRA 拆分为“小阴茎”和“大阴茎”两个版本,以获得更好控制。

(参考此文章和此文章

📒 SDXL

我非常希望将我的所有 LoRA 移植到 SDXL/Flux,尤其是 “Your Penis” LoRA。但需要注意的是,SDXL 和 Flux 并未在包含生殖器或详细解剖特征的数据上进行过微调,而像 Pony 这类模型则是基于超过 10,000 张包含详细解剖结构的全身图像进行微调的。由于缺乏相关训练数据,训练 SDXL/Flux 生成准确的生殖器特征将更具挑战性,需要大量专门的数据集以确保准确性。这意味着我必须准备一套全新的训练文件,包括高质量的全身图像,才能正确微调模型。

  • 学习率:1e-5(0.00001)

  • 精确步数:3000–5000 步

  • 精确批次大小:每批次 4–8 张图像

  • LoRA 秩 / 缩放:秩 4,缩放因子 0.8

  • 图像分辨率:512×512

📒 训练数据集(适用于 SDXL / Flux)

此范围通常能提供足够的姿势、光照和场景变化,确保 SDXL 1.0/Flux 在学习细节的同时避免过拟合。

  • 特写镜头(50%):

  • 中景镜头(30%):

  • 全身/远景镜头(20%):

📒 Flux Dev

  • 噪声调度器设置与 SDXL 默认值一致。

  • 若硬件受限,可使用梯度累积步数,但多数用户仍使用 1–2 步。

  • 优化器:通常使用带权重衰减 0.01 的 AdamW。

  • 学习率:1e-5

  • 步数:3000 至 5000

  • 批次大小:4

  • LoRA 秩:4

  • 缩放因子:0.8

📒 V4.3 和 V4.2 的问题:

在训练 Pony 风格的 SDXL LoRA 时,目标是复现训练数据集中的特定风格/角色。但使用 Repeats 5、Epochs 40、Network Dim 64、Network Alpha 64 导致过拟合(V4.3),在与高质量合并基础模型或其他 LoRA 搭配使用时产生故障。另一方面,使用 Repeats 2、Epochs 10、Network Dim 64、Network Alpha 64 则导致欠拟合(V4.2),生成的风格“半成品”,缺乏细节。

Unet 块权重图(V4.3E21)显示分布不均,表明某些层激活过强,意味着某些特征被过度放大。训练过程可能过度强化了某些层,导致不同设置下输出不一致。

🍌 版本 4.3 — 高保真度。

V4.3E21 理论上可生成比 V4.2 高五倍保真度的逼真图像。新的标签方法允许更好地控制阴茎尺寸、阴毛和睾丸。所有 LoRA 均基于 Pony 模型训练,仅适用于选定的 Pony 模型,请忽略 SDXL / illustrious 标签,我正在测试兼容性。详见下方 54 个检查点的评测。

📒 检查点推荐:

🍌 SDXL 的局限性

  • 像 Duchaiten Pony Real 这样的检查点生成的图像细节惊人,但在叠加其他 LoRA 时过于繁复,SDXL 无法有效分配采样步数至不同元素。

  • 与 Flux 不同,在 SDXL 中全身生成效果不佳,因为潜在 U-Net 在去噪初期未分配足够的特征空间。

  • Duchaiten Pony Real 和 Your Penis V4.3 在生成时共享有限的去噪 U-Net 采样步数,导致肢体缺失、面部变形和阴茎畸变。

  • 这解释了为什么 Your Penis V4.3 与 PVC 风格基础模型配合完美——因为 PVC 材质易于渲染。

  • Duchaiten 和 Penis V4.3 各自表现良好,但在 SDXL 中,复杂图像的去噪步数分配不均,导致高分辨率修复放大伪影。离线修复可能有效。这似乎已触及 Pony 模型的极限,是时候转向 illustrious 和 Flux 了。

📒 重要说明:

  • V4.3E21(五倍保真度):与其他 LoRA(不超过两个)配合使用时,从 0.5 的 LoRA 权重和低 CFG 值 3.5 开始(高 CFG 值会生成更锐利的输出)。最适合用于内补绘制。

  • V4.3E41(十倍保真度):此超保真版本仅作为独立 LoRA 使用。其输出质量已超越 Flux 生成的图像。最适合用于内补绘制。

  • V4.3E17 和 V4.3E11:这些是微调版本,应能与多数 Pony 检查点配合使用,效果较温和。

📒 此 LoRA 的两种用途:使用触发词 “penis” 生成真实阴茎;若使用以动漫风格为主的检查点,需额外添加触发词 “realistic”。

📒 提升照片真实感,尤其在不使用触发词的情况下增强毛发细节:

  • 使用 epoch 低于 7 的 LoRA(如 V03E06)以获得稳定结果,尽管 epoch 更高的 LoRA(如 V03E10)更贴近训练源;(此规则不适用于 V4 及之后版本)

  • 每次使用尽量少的触发词,以获得最佳效果;

  • CFG 值在 4.5(复杂场景)至 7.5(简单场景)之间;

  • 对于动漫风格,从较低步数(如 19)开始训练,使用 Euler a 采样器;若满意结果,可使用高分辨率修复/面部修复(并将 Euler 调至 29)以提升整体质量;

  • 对于写实照片,使用 DPM++2M Karra,特写肖像至少 30 步,全身照至少 35 步。

  • 没有适用于所有生成的通用提示词/LoRA 权重。若使用动漫风格/角色 LoRA 搭配写实检查点,建议从较低 LoRA 权重(如 0.7)开始。请忽略样本图像中的 LoRA 权重值,因近期存在一个 bug,线上生成的图像无论实际值如何,均显示为 1。

  • 步数设置(影响所有标签的权重)与提示词复杂度密切相关。若结果出现多余物体(如手指或肢体),请降低步数值(同时降低 LoRA 权重);若结果缺失物体、质感或真实感不足,请提高步数值。

🍌 版本 4.3(高保真度)更新:

  1. 使用带下划线的标签。

  2. 使用“慢烤”技术,配合恰当的重复次数与 epoch 比例。

🍌 版本 4.2(低保真度)更新:

  1. 新的人种比例:7 非裔 | 3 拉丁裔 | 87 高加索裔 | 71 亚裔

  2. 新的状态比例:60 疲软 | 38 勃起 | 66 半勃起

🍌 版本 4.1 更新:

  1. V3 的部分源图包含需要裁剪或移除的肢体。这些肢体导致 V3 偏离对阴茎的关注,造成扭曲和双阴茎现象,而这在 V2 中从未发生。

  2. 移除包皮异常的资源。

  3. 将训练资源数量减少至 ???,因为这是我的大多数 LoRA 普遍存在的问题:训练图像过多会降低输出质量,图像资源的质量比数量更重要。

  4. 提高训练资源分辨率。

  5. 将训练步数减少至 1000,我发现较低 epoch 的 LoRA 能获得更稳定的结果。

📒 镜像

我注意到一些网站,如 Modelslab 和 yodayo,使用机器人镜像我的模型。特别是 SeaArt,其下载量和生成量数据非常大。

  1. 我不介意你镜像我的模型——像 civitaiarchive 这样的网站一直都在这么做。

  2. 但我介意你阻止用户下载模型,并强制他们使用付费在线服务。

  3. 我也介意你声称版权或赋予用户生成内容的所有权。这些是开源模型,基于开源基础,使用有限所有权的数据训练。任何人都不应声称版权——包括我自己。只需注明来源即可。

此模型生成的图像

未找到图像。