ltx-video (txt2vid - img2vid)- 77oussam

详情

模型描述

最佳结果的推荐设置

为了充分发挥此模型的性能,请遵循以下设置:

  • 分辨率: 使用 768x512 以在速度与画质之间取得平衡。

  • 批量大小: 保持为 1,以实现更快、更精确的渲染。

  • 步数: 设置为 20-30,以获得细节充足且流畅的输出。

  • 采样器: 选择 DDIMEuler a,以确保快速且逼真的效果。

  • 随机种子: 为可复现性,设置固定种子,例如 42


开始使用:下载模型

该模型可在 Hugging Face 上获取:
下载 LTX-Video 2B v0.9


测试用示例提示词

以下是一些精心设计的提示词,用于展现模型在人像生成方面的能力:

提示词 1:

一个卷曲棕发、大而好奇的绿色眼睛的男孩,站在黄昏时分的草地边缘。他的圆脸被周围飞舞的萤火虫柔和光芒照亮,脸颊因奔跑而泛红。他身穿一件简单的白色T恤,衣领上有草渍,外搭一条牛仔背带裤。

镜头捕捉到他伸出双手试图捧住一只萤火虫的特写,表情中充满惊奇与兴奋。他右脸颊上有一道淡淡的污迹,略显干裂的嘴唇微微张开,轻声惊呼。

背景中,高大的野花在微风中摇曳,远处农舍的轮廓若隐若现,光线柔和而模糊。音频中传来蟋蟀轻柔的鸣叫和树叶沙沙的声响,增强了场景的魔幻与怀旧氛围。

提示词 2:

一个卷曲棕发、大而好奇的绿色眼睛的男孩,站在黄昏时分的草地边缘。他的圆脸被周围飞舞的萤火虫柔和光芒照亮,脸颊因奔跑而泛红。他身穿一件简单的白色T恤,衣领上有草渍,外搭一条牛仔背带裤。

镜头捕捉到他伸出双手试图捧住一只萤火虫的特写,表情中充满惊奇与兴奋。他右脸颊上有一道淡淡的污迹,略显干裂的嘴唇微微张开,轻声惊呼。

背景中,高大的野花在微风中摇曳,远处农舍的轮廓若隐若现,光线柔和而模糊。音频中传来蟋蟀轻柔的鸣叫和树叶沙沙的声响,增强了场景的魔幻与怀旧氛围。


撰写长提示词的建议

  1. 详尽描述: 细致刻画主体的特征、服饰和环境。

  2. 使用电影化语言: 着重描述光影、镜头角度和背景元素。

  3. 突出情感: 描绘情绪或表情,为画面增添深度。


性能评估

在测试中,该模型:

  • 一致生成高分辨率、写实风格的人像。

  • 在头发、皮肤和衣物等纹理细节上保持精准。

  • 在中端显卡上,每帧生成时间约为 3-8 秒

此模型生成的图像

未找到图像。