LTX-2 DEV - IMAGE to Video and TEXT to Video with Ollama

LTX-2 DEV 带音频视频：

图像到视频 和 文本到视频 工作流，均可使用自定义提示词或 Ollama 生成/增强的提示词。

我使用以下 ComfyUI 启动参数以避免 OOM（我的配置：16GB 显存 / 64GB 内存）：

--lowvram --cache-none --reserve-vram 6 --preview-method none

在 Sampler 子图节点中查找 Model/LoRA 加载节点。

下载文件：

- 蒸馏（lora-384）及 空间超分 LoRA：https://huggingface.co/Lightricks/LTX-2/tree/main

- VAE（已包含在上述 dev_FP8 模型中，但若使用 GGUF 模型则需单独下载）：https://huggingface.co/Lightricks/LTX-2/tree/main/vae

- Ollama 模型：

保存位置：

📂 ComfyUI/

├── 📂 models/

│ ├── 📂 checkpoints/

│ │ ├── ltx-2-19b-dev-fp8.safetensors

│ ├── 📂 text_encoders/

│ │ └── gemma_3_12B_it_fp8_e4m3fn.safetensors

│ ├── 📂 loras/

│ │ ├── ltx-2-19b-distilled-lora-384.safetensors

│ └── 📂 latent_upscale_models/

│ └── ltx-2-spatial-upscaler-x2-1.0.safetensors

使用的自定义节点：

https://github.com/Lightricks/ComfyUI-LTXVideo

仅文本到视频：

Res2_s 采样器（可选，Lightricks 推荐，但较慢；替代采样器：euler、euler_ancest）：