🚨 Hunyuan - Triple LoRA - Fast Workflow - RAM offload (720p on 3090) BY BIZARRO🚨

详情

模型描述

更新:改进了说明和用户体验。欢迎告诉我你的想法。

此外,我会为所有上传并标记此模型的用户打赏Buzz,秀出你们精彩的作品吧! :)

V1.5 720P 已发布:前一版本的信息请见下文。


我已添加 ComfyUI-MultiGPU,这简直是革命性的进步! 这项改进让你能够在以前无法实现的分辨率下运行Hunyuan。我的工作流原本性能就已很稳定,但加上这个插件并启用sage attention后,我实现了以下生成时间:

3090,24GB显存。97帧,24fps,加载两个LoRA。

720x480:217秒(3.6分钟)
960x544:362秒(6分钟)
1240x720:800秒(13分钟)

感谢 firemanbrakeneck 教我如何安装sage,以下是你要的指南,但过程相当繁琐:

https://www.reddit.com/r/StableDiffusion/comments/1h7hunp/how_to_run_hunyuanvideo_on_a_single_24gb_vram_card/

完全感谢 Silent-Adagio-444,这位插件背后的天才,也帮助我实现并为我的工作流微调了它。

我会尽量把说明保持简单和简洁。你可能需要根据你的系统调整节点设置。

操作步骤:

  1. 通过Comfy Manager或Git 安装 ComfyUI-MultiGPU

  2. 安装 ComfyUI-GGUF(此为必需!)

  3. 此链接 下载LLM的GGUF版本,并将其放入Unet文件夹中。

  4. 配置 UnetLoaderGGUFDisTorchMultiGPU。 我将其设为 4.5,但如果你的显存较低,可能需要调高该数值。请自行实验,找到最适合你的系统的值。

这里的设置针对我的系统优化:RTX 3090(24GB显存)和64GB内存
你必须调整参数,以找到最适合你硬件的配置。

对于 720p,我使用 Fast Hunyuan GGUF Q4_K_M

分配的显存越少,速度越慢。没有免费的午餐!
请为你的设备找到最佳平衡点。

关于工作流及前一版本的通用信息:

大家好,我是Bizarro,经过无数小时的优化,很高兴与大家分享我用来从Hunyuan中榨取最高品质与性能的工作流。

必须致谢,该工作流基于 这位YouTuber的工作流,我已调整设置数周,力求达到最佳画质。

我也终于解决了许多人遇到的多LoRA问题!🚀 你可以混合使用最多三个LoRA,而不会损失画质,甚至能在同一场景中放置多个角色。最佳效果是两个,但我在示例中成功使用了三个(Bizarro LoRA、神奇女侠LoRA、灭霸LoRA)。

说明: 我在示例生成中有点幸运——那是第一次尝试。后来我发现,要稳定地控制多个LoRA非常困难。但这个工作流确实极快,结果也非常出色。我会持续添加更多示例。这个工作流也非常适合将LoRA风格与LoRA角色结合使用。

你必须正确编写提示词,清楚描述角色:例如“一名白人男性”,服装、体型、在画面中的位置等。

此工作流针对3090显卡高度优化,可在不到八分钟内生成960x544分辨率下的97帧。如果你使用显存更低的显卡,可以尝试使用更小的GGUF版本,或降低质量至480p。

如需更多实验,欢迎在 X 上关注我

我整天都在谈论视频生成,同时也会制作 搞笑视频。]

我使用的GGUF版本在此:链接:

我试过许多LoRA节点,结果都很差。直到我发现了 这个节点,才实现突破:

请确保将模式设为 “按顺序”。只需选择你想要的LoRA,并使用准确的触发词详细描述每个角色。

多个LoRA权重值对应去噪过程中的不同步骤,控制每个阶段LoRA的影响程度。前期较高的权重塑造整体结构,后期权重则细化细节。这使得融合更加细腻,确保LoRA的效果并非均匀应用,而是动态适应整个图像或视频生成过程。

它对两个角色效果极佳,但如果你有耐心,也可以用在三个角色上。

这不仅适用于角色LoRA,也适用于所有类型的LoRA。

我非常期待看到你们的创作!

爱你们的,


Bizarro先生

此模型生成的图像

未找到图像。