Koharu_Experiment

详情

下载文件

模型描述

使用 20 个 CG 和角色精灵进行测试版本训练,每个噪声水平(高和低)各训练 20 个周期,repeat=10。我认为结果偏向某种 3D 风格,而并非我想要的 2D 效果。可能需要配合风格 LoRA 一起使用。由于基础模型更偏向写实和 3D 风格,因此角色 LoRA 的结果可能在 3D 或写实风格下表现更好。

该模型对提示词的理解非常出色,但如果角色 LoRA 的训练中未包含视频,结果就不那么理想。所有输出均使用 Light 1.1 生成。我看到有人提到 Light2 v1.1 会导致角色动作缓慢,但我对此并不完全确定,也可能是因为我的训练过程问题——训练集的多样性可能过于有限。

type = 'adamw_optimi'

lr = 2e-5

betas = [0.9, 0.99]

weight_decay = 0.01

stabilize = false

此模型生成的图像

未找到图像。