Anime style lora M1 | Wan2.1 & 2.2 T2V 14B

详情

下载文件

模型描述

触发词:动漫风格女孩。

已训练:musubi-tuner,20~30张AI插图。

描述:由Qwen2.5-VL-3B调整的描述(包含背景描述)。

lr:(2e-4,flow_shift3.0)

epoch:100

train_step:3000

lora_strength:0.8

示例提示:初音未来,动漫风格女孩。(她正在弹奏贝斯吉他:1.2)在卧室中。

动作需根据强化提示进行调整,或配合使用运动LoRA。

Action prompt should be adjusted depending on emphasis prompt. Or motion lora use together.

-----------------------------------------------

・当使用kijai的Causvid v2_lora,将step从20、cfg从6.0调整为step=10、cfg=1.0时,

视频生成速度提高了4倍,但生成质量不佳,且提示中的动作难以体现。

通过提高提示强化倍率,问题得到解决,动作开始遵循提示内容。

角色LoRA也存在提示动作难以体现的情况,应属同一问题。

另一方面,生成质量较差,因此我尝试制作了风格LoRA。

虽然将cfg设置为大于1时质量会提升,但生成时间会翻倍,我希望保持cfg=1.0的同时提升质量。

我收集了由图像生成AI创作的图片,并将其分为三类,分别训练了三个LoRA:

M1:动漫风格,M2:简约可爱插画,M3:复杂精美的插画。

建议基本与Causvid LoRA配合使用。

由于使用了多个LoRA,若出现LoRA加载故障,需重启ComfyUI。

此模型生成的图像

未找到图像。