hoshino ruby dance - CogVideoX1.5-5B-I2V img2vid
详情
下载文件
模型描述
这是我首次使用LoRa进行CogVideoX1.5-5B-I2V的实验。
LoRa的质量可能因以下原因而受到影响:
使用45段13帧的视频,固定分辨率为720x480进行训练
训练时仅使用单个词作为提示词
由于动画的特殊性,导致动作非常卡顿。
当Framer或其他优秀的2D视频插值方法发布时,我将尝试重新训练LoRa。
请尝试调整视频的播放速度。
以下是我在示例中使用的参数:
提示词:慢动作,缓慢流畅的舞蹈,Live2D动画
LoRa强度:0.8
13帧(建议使用53帧,因为13帧时视频有一半是静态的)
采样步数:25
