Vision Realistic DiT

详情

模型描述

视觉写实模型概述

我很高兴向您介绍我最新的检查点模型,该模型基于 HunyuanDiT-v1.2。此模型经过超过 80,000 步的训练,以确保生成高质量、逼真的图像。

模型详情:

  • 类型: 写实模型
  • 触发词: 无需触发词
  • 中文支持: 不支持
  • 输出: 高细节、高分辨率图像,高度接近真实照片

训练配置:

  • GPU: A6000
  • 数据集: 5,000 张图库照片与我自建数据集的组合
  • 批量大小: 2
  • 优化器: AdamW
  • 调度器: Cosine
  • 学习率: 1e-5
  • 训练轮数: 目标为 100 轮
  • 标注: 混合使用 WD14 和 BLIP
  • 训练时间: 27+ 小时(经验:较差;未来训练尚未决定)

快速指南与参数:

  • VAE: SDXL
  • 采样器: dpmpp_2m
  • 调度器: sgm_uniform(推荐以获得最佳效果)
  • 采样步数: 25+ 步
  • CFG 值: 7

为获得更好效果,建议使用 ComfyUI:

在 tensor.art 上可使用,提供免费 GPU 加速

重要提示: 请避免在提示词中使用 NSFW/成人内容,以免导致结果不可靠。此外,较短的提示词在 SD3 和 DiT 模型上效果更佳。

备注:

此模型并非合并或修改版本,而是原始的 Realistic Vision 微调模型。部分用户已在模型评论区传播错误信息。若您有任何疑问或想了解更多,请加入我的 Discord 服务器,或在评论区分享您的想法。感谢您的时间。

此模型生成的图像

未找到图像。