LTX-2.3 Multi-Block Video Generator with AI Prompt Auto-Enhancer

Details

Model description

👋 Привет! Перед вами простой, последовательный и модульный воркфлоу для создания плавных видеороликов из картинок (Image-to-Video) на базе модели LTX-2.3!

Схема специально собрана из стандартных базовых блоков ComfyUI и упакована в аккуратные субграфы, чтобы логика генерации (от кадра к кадру) оставалась прозрачной и понятной для новичков.

Данный процесс по сути является стандартным и не претендует на абсолютную уникальность, однако он более тонко настроен: в него добавлены более стабильная модель, лоры и автоматизация.

🇷🇺 РАБОТА НА РУССКОМ ЯЗЫКЕ:

Встроенный автопромптер ПРЕКРАСНО понимает запросы на русском языке! Вы можете писать простые действия прямо на русском — во время тестов никаких глюков или сбоев замечено не было. Тем не менее, если вы хотите получить максимальную точность физики от модели, можно использовать и английский язык.

🔥 ГЛАВНЫЕ ФИШКИ СХЕМЫ:

1. Умный Автопромптер (на базе Qwen2.5-Instruct) — автоматически превращает короткие фразы на русском в подробные технические сценарии движений тела, одежды и волос .

2. Никаких галлюцинаций камеры — настройки ИИ зажаты так, что он наглухо блокирует любые дёрганья, пролёты или зум камеры. Видео остаётся стабильным, а LTX идеально считывает внешность с вашего исходного кадра (если обратное движение камеры не указано вами в промпте напрямую).

3. Модульный пульт управления — с помощью ноды Fast Groups Bypasser можно в один клик временно отключать блоки генерации или апскейлер для экономии времени и ресурсов.

4. Встроенный видео-апскейлер — на выходе вы получаете не размытый исходник LTX, а чёткое, увеличенное в 2 раза качественное видео с плавными 24 FPS.

⏱️ ВАЖНОЕ ОГРАНИЧЕНИЕ ПО ДЛИТЕЛЬНОСТИ:

  • Безграничное удлинение: Этот модульный процесс полностью снимает базовые лимиты модели LTX-2.3 (которая стандартно выдает лучшие результаты на коротких отрезках в 5–10 секунд).

  • Бесшовная склейка: Благодаря последовательной генерации и автоматической склейке кадров, вы можете легко создавать цельные простые (!) ролики длиной до 30 секунд и более за один проход.

  • Масштабируемость: Итоговый хронометраж ограничен только мощностью вашего железа. Вы можете свободно добавлять новые блоки генерации в схему, чтобы продлить видео на любую нужную вам длину.


Этот генератор не является профессиональным, но он показывает отличную стабильность до 10 секунд на один блок. Сама модель LTX обучалась в основном на отрезки в 5–10 секунд. Если вы выставите длительность больше 10 секунд для одного шага, стабильность не гарантируется — видео может начать сильно «плыть». Для создания длинных видео просто добавляйте новые последовательные блоки по 5–10 секунд.

⚠️ ВАЖНО ПЕРЕД УСТАНОВКОЙ (Для кастомных нод):

Поскольку в схеме используются сторонние кастомные узлы для автоматизации (Multimodal LLM / GGUF), для их корректной компиляции и сборки зависимостей в системе ОБЯЗАТЕЛЬНО должен быть установлен официальный пакет инструментов Microsoft Visual Studio:

🔗 Скачать Visual Studio: https://microsoft.com

(При установке обязательно выберите галочку "Разработка классических приложений на C++"). Также не забудьте докачать необходимые .gguf модели текстовых генераторов через ComfyUI Manager.

💻 СИСТЕМНЫЕ ТРЕБОВАНИЯ:

Для комфортного запуска и стабильной генерации видео вашей системе необходимы следующие характеристики:

  • Видеокарта (VRAM): Минимум 8 ГБ видеопамяти.

    • Важно: Если в процессе генерации возникают ошибки нехватки памяти (Out of Memory), просто снизьте разрешение исходных картинок.

  • Оперативная память (RAM): Минимум 16 ГБ. Принцип простой: чем больше объем ОЗУ, тем стабильнее работает сборка.

  • Накопитель (ROM): От 512 ГБ свободного места. Крайне рекомендуется использовать быстрые SSD (NVMe), чтобы модели загружались без задержек.

  • Операционная система: Windows 10 или Windows 11.

  • Программная среда: Обязательно наличие актуальных драйверов NVIDIA CUDA для полноценного ускорения вычислений на GPU.

Images made by this model