此工作流将接收一个相当简单的(单句)文本提示,将其输入大语言模型(LLM),由该模型将简单提示转化为沉浸式且详细的提示,以生成(Flux)图像。
该图像将被放大,并连同相同的生成详细提示一起输入LTX与STG,以完成最终的视频转换。