car_design-sketch

详情

模型描述

版本发布

  • v0.8:当前为测试模型,建议您观察我的示例图片并提供反馈。

概述

本模型旨在生成汽车设计过程中手绘草图风格的渲染效果。我计划训练一系列模型来解决这一问题,本模型是该系列中的一次尝试。模型基于SDXL架构,并使用DynaVision XL模型进行微调。

数据

我收集了约3K张手绘汽车图像。目前似乎没有专门收录大量手绘汽车图像的网站或数据集,因此数据来源多样。数据仅经过基础标注,未进行分类或人类偏好筛选(我没有时间完成此项工作,但未来可能会补充)。数据标注未经筛选,直接提供。

训练

如上所述,我没有选择SDXL的基模型进行训练,原因是我认为其2D性能不佳,或者说不如DynaVision XL_ Release_v0.6.1.0-bakedvae模型,因此选择了后者作为训练基模型。

使用的训练脚本为sd-scripts,以下是部分详细参数:

  • base_model: dynavisionXLAllInOneStylized_releaseV0610Bakedvae.safetensors

  • resolution: 1024

  • max_train_epochs = 20

  • device = 4090 X 2

  • clip_skip = 2

  • save_precision = fp16

  • network_module = lycoris.kohya

  • network_dim = 16

  • network_alpha = 8

  • train_batch_size = 16

  • gradient_checkpointing = true

  • gradient_accumulation_steps = 1

  • real_batch_size = 32

  • lr_scheduler = constant

  • min_snr_gamma = 5

  • multires_noise_discount = 0.3

  • multires_noise_iterations = 10

  • unet_lr = 2e-4

  • text_encoder_lr = 2e-4

其他说明

目前我仅发布部分测试结果,诚邀您观察并提出建议,以便我明确模型改进方向。

待办事项

  • 更多图像

  • 更好的标注

  • 寻找更优的基模型(可能)

工具提供方:ChatGPT (OpenAI)

此模型生成的图像

未找到图像。