Yaoi Diffusion
详情
下载文件
关于此版本
模型描述
Yaoi Diffusion V3
大家好!
这是一个在 yaoi、bara、furry、s...., s.... c..、美术作品及真实男性图像上微调的 768 分辨率模型,简而言之,是一个通用的同性恋向模型。
以下是版本 3 可识别的标签列表:
https://gist.github.com/iszotic/0ccac5c804e9587a323fffd4cbbd6c03
提示词使用方法:
[简短描述] 以 [角色] 形式,源自 [版权信息],由 [艺术家] 创作,[e621/gelbooru 标签,用逗号和空格分隔]。
正向标签:by _alter
负向标签:简单背景
示例:
一个拟人化的furry龙形男性躺在床上,由artist_tag创作,1male,男性焦点,单人,胸肌,生殖器,写实风格
另外,请查看演示图及使用的提示词,高分辨率效果是通过高分辨率修复(high res fix)实现的。
_other,是另一种风格,通常是平涂风格或简化风格。
_alter,是替代风格,通常为柔和着色版本。
使用 1male 而非 1boy,2males 代表 2boys,以此类推。男孩指年轻的男性,而男性可以是幼兽、成年男性、老人、青年、动物,甚至花朵等——范围更广。
风格混合方法:
有两种混合风格的方式:
1)在扩散过程中每一步自动交换艺术家标签(适用于 auto1111)
by [artist1|artist2|artist3|artist4]
2)同时使用所有标签:
by artist 4 by artist 3 by artist 2 by artist 1
在 1)中,首位艺术家主导,特征更贴近该艺术家,但混合效果更明显。适用于 Euler a、Euler 和 DDIM 采样器,缺点是画质较差。
在 2)中,最后一位艺术家主导,特征更贴近该艺术家,但混合效果有时不明显。适用于任何采样器,画质更好。
商业用途: 可以使用,只要最终风格不明显模仿任何特定风格即可。
特性:
- 超过1300+位同性恋主题艺术家标签(包括我自己,哈哈哈),未使用纯3D艺术家的标签。
- 支持NSFW与SFW内容。
- 部分艺术家支持多种风格。
训练细节:
从 SD1.5 原版 + vae-ft-mse-840000-ema-pruned.ckpt 训练而来
数据集共 26 万张图像,每轮训练使用 14 万张,评分数据集 4 千张,评分数据集丢弃概率为 0.5,非评分数据集丢弃概率从 0.0 到 0.15 不等,根据 https://github.com/LAION-AI/aesthetic-predictor 和 https://huggingface.co/cafeai/cafe_aesthetic 的审美评分动态调整。
图像来源为 booru 站点,标签通过 deepdanbooru 整理,e621 模型来自 zach,wd14 swing 模型,若图像非 booru 来源,则使用标签预测,标签顺序有 5% 概率随机化。同时使用了 blip2-opt-6.7b
https://github.com/toriato/stable-diffusion-webui-wd14-tagger
使用 Everydreamertrainer2,禁用梯度检查点,启用梯度累积。
数据集中 1% 用于验证。
训练调度:(哎呀)
在 512 分辨率下:
第 1-16 轮,有效批次大小:120(12×10),学习率:4e-6,EMA:0.9995
第 17-19 轮,有效批次大小:60(12×5),学习率:2e-6,EMA:0.9997
第 20-40 轮,有效批次大小:12(12×1),学习率:5e-7,EMA:0.9999在 768 分辨率下:
第 40-51 轮,有效批次大小:64(4×16),文本学习率:1e-6,UNet 学习率:2e-6,EMA:0.9997
第 52-72 轮,有效批次大小:12(4×3),文本学习率:3e-7,UNet 学习率:6e-7,EMA:0.9999每轮训练中每位艺术家最多使用 125 张图像,如果某艺术家有 500 张,则仅采用不同的一组 125 张图像。
零频率噪声比例 = 0.02
附记:
或许这将是我在 SD1.5 上最后一次微调的模型。









