hoshino ruby dance - CogVideoX1.5-5B-I2V img2vid

详情

模型描述

这是我首次使用LoRa进行CogVideoX1.5-5B-I2V的实验。

LoRa的质量可能因以下原因而受到影响:

  1. 使用45段13帧的视频,固定分辨率为720x480进行训练

  2. 训练时仅使用单个词作为提示词

  3. 由于动画的特殊性,导致动作非常卡顿。

当Framer或其他优秀的2D视频插值方法发布时,我将尝试重新训练LoRa。

请尝试调整视频的播放速度。

以下是我在示例中使用的参数:

提示词:慢动作,缓慢流畅的舞蹈,Live2D动画

LoRa强度:0.8

13帧(建议使用53帧,因为13帧时视频有一半是静态的)

采样步数:25

此模型生成的图像

未找到图像。