应要求。一个有趣的挑战!
发布为“版本0.9”,因为仍存在一些bug。约50%的生成结果中可能出现强烈的身体恐怖效果。
140亿参数的文本到视频模型。适用于文本到视频(T2V)或图像到视频(I2V)。
带有红发少女的预览为I2V;写实风格预览为T2V。
基础训练提示语:
她正用脚掌碾压玻璃,扭动着脚。她是一个巨人。
更多提示建议请参见预览效果。
此外,还提供了一个图像LoRA,如需生成输入图像可使用。