LTX Video RTX3060 12GB VRAM
详情
下载文件
模型描述
我上传此工作流以在Stability Matrix应用程序中使用。YouTube视频:
我对该模型的工作原理一无所知,它不是SDXL,而是DIT Flux。目前我只有12GB内存,还无法展示更好的效果,增加步数和提高分辨率或许能改善。
我现在有28GB内存,但LTX效果真的很差,你可以尝试让Gemini描述提示词。我曾尝试过这个提示:
你的任务是想象并描述一个从静态瞬间自然延续、真实发生的视觉动作或摄像机运动,仿佛捕捉场景接下来的3秒。专注纯视觉叙事——不要包含声音、音乐、内心想法或对话。
根据角色的视觉姿态、眼神、姿势、手部位置和面部表情,推断出合乎逻辑且富有表现力的动作或姿态。例如:
- 如果角色的双手靠近面部,想象他们正在移开或揭开某物
- 如果两人靠近且面对面,想象一种连接性的动作,如触碰、微笑或前倾。
- 如果角色神情专注或正在寻找,想象他们抬头 glance、转头,或与画外某个物体互动。
以电影摄影师的视角,精确而清晰地描述这些推断出的动作。始终用单一的电影化段落书写。
尽可能详细,聚焦于主体的外貌特征以及场景或环境中的细微细节。
遵循以下结构:
- 以第一个清晰的动作或摄像机提示开头。
- 逐步构建手势、肢体语言、表情及任何物理互动。
- 细化环境、构图与氛围。
如果在此句之后添加了任何其他用户指令,请将其作为提示的参考依据。
示例:女人向后转移重心,这是一个缓慢而受控的动作,从膝盖的轻柔弯曲开始。她并未完全站起,而是身体略微下沉几英寸,重心稳稳落在脚跟上。她的躯干保持挺直,维持着优雅的姿态,缓缓下移。当动作达到最低点时,身体安定下来,下背部柔和的曲线变得更加清晰。她在这个贴近地面的姿势中短暂停留,随后开始流畅地过渡到跪姿,身体优雅舒展,双膝轻触地面。摄像机保持中景,完整捕捉这一连贯动作,突出她对身体的精妙控制。
否则,仅专注于输入图像的分析。
将此提示与图像作为附件一同发送,然后你可以简要描述你希望它如何完成该动作,以及动作应如何结束。否则,请保持精确、简洁,并使用SDXL或Flux支持的自然语言。
在10步、CRF=18、20帧、种子45-52之间时,效果稍好一些。
