Cosmos Base 2B T2IMG
详情
下载文件
模型描述
这是一个与 ComfyUI 正常兼容的基础检查点。建议设置 --fp8_e5m2-unet --fp8_e5m2-text-enc 以防止崩溃。
它的速度比 SDXL 慢,可能是因为它较新且代码尚未优化,但效果要好得多。它支持 512 像素到 2048 像素之间的分辨率,以及各种极端长宽比。
CFG 值建议在 2-10 之间
步数建议在 15-60 之间
我不是该模型的原始创建者,我只是将其整合为单个文件,以便艺术家更方便使用。
该模型在所有标准下都表现出色,对人体结构理解优秀,安全可靠,构图能力卓越。
Cosmos 包含四个模型:Cosmos-Predict2-2B-Text2Image 和 Cosmos-Predict2-14B-Text2Image 用于从文本描述生成高质量图像的文生图任务,以及 Cosmos-Predict2-2B-Video2World 和 Cosmos-Predict2-14B-Video2World 用于从图像或视频输入生成视觉模拟的视频生世界任务。为加速物理 AI 世界模型的发展,我们根据 NVIDIA 开放模型许可证提供我们的 代码、模型权重 和基准测试工具 (PBench)。





