Vision Realistic DiT
26
799
详情
下载文件
模型描述
视觉写实模型概述
我很高兴向您介绍我最新的检查点模型,该模型基于 HunyuanDiT-v1.2。此模型经过超过 80,000 步的训练,以确保生成高质量、逼真的图像。
模型详情:
- 类型: 写实模型
- 触发词: 无需触发词
- 中文支持: 不支持
- 输出: 高细节、高分辨率图像,高度接近真实照片
训练配置:
- GPU: A6000
- 数据集: 5,000 张图库照片与我自建数据集的组合
- 批量大小: 2
- 优化器: AdamW
- 调度器: Cosine
- 学习率: 1e-5
- 训练轮数: 目标为 100 轮
- 标注: 混合使用 WD14 和 BLIP
- 训练时间: 27+ 小时(经验:较差;未来训练尚未决定)
快速指南与参数:
- VAE: SDXL
- 采样器: dpmpp_2m
- 调度器: sgm_uniform(推荐以获得最佳效果)
- 采样步数: 25+ 步
- CFG 值: 7
为获得更好效果,建议使用 ComfyUI:

在 tensor.art 上可使用,提供免费 GPU 加速
重要提示: 请避免在提示词中使用 NSFW/成人内容,以免导致结果不可靠。此外,较短的提示词在 SD3 和 DiT 模型上效果更佳。
备注:
此模型并非合并或修改版本,而是原始的 Realistic Vision 微调模型。部分用户已在模型评论区传播错误信息。若您有任何疑问或想了解更多,请加入我的 Discord 服务器,或在评论区分享您的想法。感谢您的时间。

















