LTX-2 -19B :Next-Gen AI Video & Audio Generation Model
详情
下载文件
模型描述
上传进行中....
即将推出:
FP8 精馏版本。
LoRA 精馏版本
空间上采样器
时间上采样器
相机控制 LoRA。
CONTROLNET AIO LTX2
工作流 I2V / V2V / T2V / VDETAILER。
⚡ LTX-2 FP8 — 精馏版(快速且轻量)
什么是 LTX-2 FP8 精馏版?
FP8 精馏版 是 LTX-2 的压缩与加速版本,经过训练以复现完整模型的行为,同时实现更快、更轻量化。
知识蒸馏降低了模型复杂度,使其更高效——但会牺牲部分精细细节。
✅ 主要特性
更快的生成速度
更低的显存需求
更快的提示响应
与完整 FP8 版本相比,细节略有减少
卓越的性能与质量比
🎯 最佳使用场景
快速迭代与测试
提示探索
草稿视频与预览
硬件资源有限的创作者
推荐选择如果:
你追求速度与易用性,并愿意为更快的结果而略微牺牲一些细节。
🔹 LTX-2 FP8 — 标准版(全质量)
什么是 LTX-2 FP8(标准版)?
FP8 标准版 是一个全质量的 LTX-2 模型,量化为 FP8 精度。
它保留了原始模型的完整架构与功能,同时降低了内存占用。
这不是一个简化模型。
仅数值精度被降低——模型的智能性、结构与行为均保持不变。
✅ 主要特性
高视觉保真度与细节
强大的时间一致性
完整的音视频同步
比 FP16 更低的显存占用
长序列生成稳定可靠
🎯 最佳使用场景
电影级视频生成
最终渲染与高质量输出
希望在较低硬件需求下获得最高质量的创作者
推荐选择如果:
你希望在 FP8 中获得最佳质量,且不妥协于任何功能或灵活性。
🧠 你应该选择哪一个?
🎬 如果质量与一致性最重要 → 选择 FP8 标准版
⚡ 如果速度与效率是优先项 → 选择 FP8 精馏版
两个版本均完全兼容 ComfyUI 工作流,并属于同一 LTX-2 创作生态系统。
📌 什么是 LTX-2?
LTX-2 是一个强大的多模态 AI 模型,可将文本提示、图像或其他媒体转化为完全同步的音视频视频——在单次生成中同时生成运动、对话、音乐和环境音效。它基于专为高效时空生成与音视频对齐而设计的混合扩散-变换器(DiT)架构。LTX-2+1
这一方法使创作者无需手动拼接音频轨道,即可从创意直达电影级成果——远超传统文本到视频系统。LTX-2
✨ 主要功能与能力
🎥 电影级输出质量
- 原生支持4K 分辨率,播放帧率最高达50 FPS,提供流畅、高细节的视频片段,适用于电影、商业或创意用途。LTX-2
🎵 统一的音视频生成
- 在单次生成中同步生成音频——包括对话、环境音和音乐——无需外部音频同步工具。LTX-2
🔄 灵活的输入与输出模式
- 支持文本提示、图像参考、多关键帧条件等,将概念或静态图像转化为动态内容。LTX-2
⚙️ 性能模式
- 多种性能配置(快速、专业、超凡)允许创作者根据项目需求平衡速度与质量——从快速草稿到生产级渲染。LTX-2
🧠 高效且易用
- 针对消费级 GPU 高度优化——在约 16GB 显存的硬件上,通过 FP8/FP4 量化即可稳定运行,使 AI 视频制作更易普及。Reddit
🛠️ 开放且可扩展
- 完全开源权重、代码与工作流,支持微调、自定义 LoRA 及集成至 ComfyUI 等工具。Hugging Face
📈 相较早期版本的改进
相较于原始 LTX 系列及其他开源视频模型,LTX-2 在多个关键领域树立了新标杆:
✅ 内置音频集成
LTX-2 直接输出具有时间一致性的音视频流,无需生成无声视频后再后期处理。LTX-2
✅ 更高分辨率与帧率
支持原生 4K,最高达50 帧每秒,达到电影级质量,远超许多早期社区模型的低分辨率或低帧率限制。LTX-2
✅ 更长片段生成
提供更长持续时间生成(最高约 20 秒),保持连续质量与音频一致性——超越多数竞品。LTX-2+1
✅ 扩展的工作流支持
原生支持 ComfyUI 及自定义工作流,赋予用户文本到视频、图像到视频、多关键帧条件及创意控制节点。comfyui.org+1
🧠 典型应用场景
🔹 电影分镜与概念视觉
🔹 社交媒体与营销视频内容
🔹 动画叙事与动态设计
🔹 游戏过场动画与沉浸式叙事
🔹 产品可视化与动态广告
无论用于快速原型还是生产输出,LTX-2 都为创作者提供了专业级生成视频能力。LTX-2
🧩 包含文件与版本
根据上传的检查点,本集合可能包含:
完整模型检查点(bf16 / fp8 / fp4)——带量化选项的最高质量
精馏版本——更低计算成本的快速迭代
空间与时间上采样器——通过多尺度管道提升分辨率或帧率
LoRA 与微调包——自定义风格或控制扩展模块 Hugging Face
🔧 ComfyUI 集成与工作流
包含的工作流模板可帮助你在 ComfyUI 中使用 LTX-2,支持以下节点:
📌 文本到视频 —— 从提示生成动画片段
📌 图像到视频 —— 通过相机运动与风格动画静态图像
📌 视频条件控制 —— 向前/向后扩展片段或优化动作
📌 关键帧控制 —— 精准引导场景过渡
这些工作流旨在易用性与创意灵活性之间取得平衡,同时展示提示结构与平滑时间运动的最佳实践。LTX 文档
🧠 基础模型理念
LTX-2 不仅是一个单一任务模型——它是一个音视频创意 AI 的基础模型。开放其权重、代码与工具,鼓励开发者、艺术家、研究人员和爱好者在统一平台上自定义、扩展与创新。Hugging Face
📌 总结
LTX-2 不仅仅是一个视频模型——它是一个生产就绪、音视频同步的基础模型,推动了开源视频生成能力的边界。凭借电影级输出质量、灵活的工作流和完全开放的生态系统,LTX-2 是当今最具能力的生成式视频工具之一。LTX-2
