car_design-sketch
详情
下载文件
关于此版本
模型描述
版本发布
- v0.8:当前为测试模型,建议您观察我的示例图片并提供反馈。
概述
本模型旨在生成汽车设计过程中手绘草图风格的渲染效果。我计划训练一系列模型来解决这一问题,本模型是该系列中的一次尝试。模型基于SDXL架构,并使用DynaVision XL模型进行微调。
数据
我收集了约3K张手绘汽车图像。目前似乎没有专门收录大量手绘汽车图像的网站或数据集,因此数据来源多样。数据仅经过基础标注,未进行分类或人类偏好筛选(我没有时间完成此项工作,但未来可能会补充)。数据标注未经筛选,直接提供。
训练
如上所述,我没有选择SDXL的基模型进行训练,原因是我认为其2D性能不佳,或者说不如DynaVision XL_ Release_v0.6.1.0-bakedvae模型,因此选择了后者作为训练基模型。
使用的训练脚本为sd-scripts,以下是部分详细参数:
base_model: dynavisionXLAllInOneStylized_releaseV0610Bakedvae.safetensors
resolution: 1024
max_train_epochs = 20
device = 4090 X 2
clip_skip = 2
save_precision = fp16
network_module = lycoris.kohya
network_dim = 16
network_alpha = 8
train_batch_size = 16
gradient_checkpointing = true
gradient_accumulation_steps = 1
real_batch_size = 32
lr_scheduler = constant
min_snr_gamma = 5
multires_noise_discount = 0.3
multires_noise_iterations = 10
unet_lr = 2e-4
text_encoder_lr = 2e-4
其他说明
目前我仅发布部分测试结果,诚邀您观察并提出建议,以便我明确模型改进方向。
待办事项
更多图像
更好的标注
寻找更优的基模型(可能)
工具提供方:ChatGPT (OpenAI)


