Typhoon SD1.5
详情
下载文件
关于此版本
模型描述

🌪️ 台风(Stable Diffusion 1.5 版本)
V1 和 V2 – 从实验性的混乱到高分辨率的狂暴
“原本作为龙卷风 V3 的项目,最终演变成了自己的五级灾难。”
“在理智和预算双双告急的情况下,呈上台风的 SD1.5 版本。”
台风(SD1.5)是我旗舰级 SDXL 模型的“小兄弟”,诞生于好奇心、固执和远少于数据集带来的悔意。
(台风 XL:/model/1610717/typhoon)
📌 TL;DR / 注意事项:
台风是一个风格化模型,其设计刻意偏向增强的写实感——电影级光影、清晰细节和标志性的“渲染真实”美学。它能够实现完全的写实效果(如智能手机级人像、宝丽来照片、胶片颗粒等),但纯粹的写实需要更精细的提示词引导。默认情况下,你将看到鲜明的细节和略带超现实的精致感——这正是台风独特魅力的一部分。
本展示使用原生输出样本:所有示例图像均在未使用任何 LoRA 或外部修饰器的情况下生成。你所见即模型核心能力。
📦 这是什么?
这是一个分阶段训练的自定义 SD1.5 模型:先对初始检查点进行微调,再训练并手动合并专用 LoRA——全程手工完成,非常艰难。你可以把它想象成用 LoRA 绷带和学习率胶带缝合起来的弗兰肯斯坦怪物。
基础模型采用的是 'v1-5-pruned-emaonly',因为原始的 runwayml/stable-diffusion-v1-5 已经不可用了。选择基础模型简直是一场噩梦——大多数不是被过度微调到面目全非,就是被改得认不出来。这个模型能撑到现在都算奇迹。
🔧 模型特征
肖像级细节: 台风在高清近景渲染方面表现卓越,无需 ADetailer,其原生细节保留能力极强。
动态光影与空间深度: 重新设计的光线行为赋予台风更出色的电影级对比度和更优的空间构图能力。
提示词简洁: 无需触发词——输出自然、响应灵敏,始终与提示意图保持一致。
台风本质上是风格化的。其默认输出生动、细致、略带渲染感,偏向“干净写实”或“类摄影真实”效果,而非纯粹原始的写实风格。你将看到强烈的光影、清晰的轮廓和内嵌的标志性渲染质感。它在人像、美妆拍摄和概念艺术方面表现卓越,但若不精心提示,不会默认呈现粗粝或纪实风格的写实感。不过,它确实能实现原始写实——你只需多花些力气在提示词上,避免使用高光泽类关键词即可。
📚 训练说明
数据集已全面重构并提升至 768 像素分辨率,修正了 V1 的诸多问题。同时增加了更多素材,以改善构图多样性和人体结构表现。现在生成全身图像时,你可能不会再想摔椅子了。
V1 时期合并所用的 LoRA 是在 512x512 分辨率下训练的,但如今已由改进后的数据集支撑。
所有示例图像均在未使用任何 LoRA 的情况下生成。
分辨率提示: 虽然你可以在 512x512、512x768 或 576x768 下生成图像,但有时会出现解剖结构异常。我推荐从 512x768 开始,尤其是当你不使用高分辨率修复时——这会产生显著差异。
🧠 底层机制
台风(SD1.5)采用混合流程创建:
- 初始基础检查点微调
- 一套专为该项目训练的 LoRA,手动合并至基础模型
- 通过大量试错,仔细平衡合并强度与权重
为辅助此过程,我开发了两个开源工具:
📊 LoRA 强度分析器
通过 SSIM 和 BRISQUE 等感知图像指标,评估 LoRA 合并效果。
📈 LoRA 迭代分析器
通过视觉指标比较不同 LoRA 训练轮次,识别最优检查点。
⚠️ 限制
NSFW 内容: 基础模型部分被“去势”。台风会尽力而为,但效果不稳定。一旦成功,效果惊人——但别指望在该领域有持续一致性。
解剖结构与瑕疵: 得益于数据集修正,V2 相比 V1 已大幅改善,但极端情况仍可能出现异常。尽可能使用高分辨率修复(Hires Fix)。
自然语言提示: 不擅长处理长句或描述性语言。为获得最佳效果,请使用简短、结构化的提示词。
🧠 提示词建议
本模型不喜欢冗长华丽的提示词。它不是 Flux。你不能用花言巧语讨好它。它偏好简洁、标签式的提示——短促、精准。这很可能是因为训练数据集以标签为主——这确实是我的失误,或者说是“booru”效应。但说真的,越简短、越具体,效果越好。
⚙️ 推荐设置
- 分辨率: 基础生成建议使用 512x640 或 576x768
- 采样器: DPM++ 2M Karras、Euler、Euler A —— 经典组合
- CFG: 多数图像建议 0.3 – 0.8
- 步数: 20–40 通常足够;若结果不佳,可增减 ±5 步
- 高分辨率修复: 强烈推荐
- 去噪强度: 0.5 – 0.7(0.5 = 更柔和)
- 放大倍率: 1.5 – 1.8x(隐空间)—— 倍率越高,瑕疵越多
- 高分辨率 CFG: 7(我将高分辨率修复的 CFG 设为与基础 CFG 相同——我知道,我有强迫症…)
⚠️ 不要对近景使用 ADetailer 或面部修复——该模型原生已能出色渲染眼睛与面部。仅在模型无法处理极端情况时谨慎使用。
💡 VAE 说明
开发期间我测试过一个旧的 .bin VAE 文件——它让颜色黯淡,整体效果仿佛在十月的柏林绕了一圈:灰暗、沉闷……你懂的。
台风的最佳表现方式是:
• 完全不加载 VAE,或
• 使用官方的 stabilityai/sd-vae-ft-ema
如果你的生成结果显得褪色或死气沉沉,那多半是 VAE 的锅。
🔒 许可与使用
依据 CreativeML OpenRAIL-M 许可证发布。
- 不得将此模型与其他模型合并。
- 不得在第三方生成服务中使用此模型。
- 可用于私人和个人生成。
- 若希望用于商业或托管环境,请先联系我。
合并或重新上传会破坏美学风格,并彻底毁掉精心平衡的 LoRA 配置——请勿如此。
🚧 已知问题
- 在窄分辨率下仍可能出现部分解剖异常。
- 未针对自然语言提示进行优化。
- V2 的数据集分辨率提升已解决 V1 的大部分全身变形问题,但边缘情况仍存在。
🌩️ ☕ 支持这场风暴
如果你喜欢我所打造的一切——台风、龙卷风、这些工具、这些混乱——并希望它们持续运转,请考虑在 Ko-fi 支持我:
https://ko-fi.com/raxephion
每一份支持都帮助覆盖算力成本、咖啡费用,以及偶尔的“这怎么又坏了?”崩溃时刻。感谢你让这场风暴持续不息。




















