ChronoEdit 14B
详情
下载文件
模型描述
加入 LUXED AI,最好的AI社区:https://discord.gg/HxfP9TnctJ
💚 ChronoEdit | 🖥️ GitHub | 🤗 Hugging Face | 🤖 Gradio Demo | 📑 Paper
ChronoEdit:面向图像编辑与世界模拟的时间推理
ChronoEdit-14B 通过时间推理实现物理感知的图像编辑和动作条件下的世界模拟。它从一个140亿参数的预训练视频生成模型中提炼先验知识,并将推理过程分为两个阶段:(i) 视频推理阶段,用于潜在轨迹去噪;(ii) 上下文编辑阶段,用于修剪轨迹标记。ChronoEdit-14B 由 NVIDIA 开发,属于 ChronoEdit 多模态基础模型系列。该模型已准备好用于商业用途。
ChronoEdit 流程概览。 从右至左,去噪过程始于 时间推理阶段,模型想象并去噪一段中间帧的短轨迹。这些中间帧作为推理标记,指导编辑如何以物理一致的方式展开。为提高效率,在随后的 编辑帧生成阶段 中,推理标记会被丢弃,目标帧进一步优化为最终编辑图像。

