WAN2.1 | FusionX | LLM | SDXL or FLUX | Upscaling
详情
下载文件
关于此版本
模型描述
WAN2.1 | FusionX | LLM | SDXL/FLUX/PONY | 上采样
SDXL 版本(PONY 文件同样无问题)使用任何 SDXL/PONY 模型进行初始图像生成与优化。
FLUX 版本在发送至 WAN 部分之前,使用独立的 SDXL 模型进行优化。
目前仍对(大多数)WAN T2V 工作流不太满意,正在尝试各种方法,以创造一种更有趣的方式实现文生 WAN 视频。
该工作流将使用一个相对简单/简短的基础提示词,输入给 LLM 以生成增强/扩展后的提示词,进而生成一组图像,并从中选出最佳或最理想的一张。
该图像将被上采样/优化,然后交由 LTXV 图像字幕器生成扩展的图像提示词(你也可以手动覆盖此步骤,自行提供提示词)。

我个人倾向于将 LLM 提示词增强器设置为固定种子。根据所使用的 LLM 模型,有时会生成过于详细的提示词,导致 SDXL 难以处理。在这种情况下,可手动更改种子。
大多数 SDXL 模型都能较好地遵循增强后的提示词(无论是 SFW 还是 NSFW)。

该图像将被上采样/优化,然后交由 LTXV 图像字幕器生成扩展的图像提示词(你也可以手动覆盖此步骤,自行提供提示词)。

默认情况下,允许加载 3 个 WAN LoRA(后接 Fusion X LoRA)。
致谢:WAN 生成主要基于 /model/1309065/wan-21-image-to-video-with-caption-and-postprocessing?modelVersionId=1998473(用户 tremolo28)并做了部分修改。
用于测试和生成所发布视频的硬件:
RTX 4070 Ti Super 16GB 显存 / 80GB 内存