LTX-2.3 Multi-Block Video Generator with AI Prompt Auto-Enhancer
Details
Download Files (1)
Model description
👋 Привет! Перед вами простой, последовательный и модульный воркфлоу для создания плавных видеороликов из картинок (Image-to-Video) на базе модели LTX-2.3!
Схема специально собрана из стандартных базовых блоков ComfyUI и упакована в аккуратные субграфы, чтобы логика генерации (от кадра к кадру) оставалась прозрачной и понятной для новичков.
Данный процесс по сути является стандартным и не претендует на абсолютную уникальность, однако он более тонко настроен: в него добавлены более стабильная модель, лоры и автоматизация.
🇷🇺 РАБОТА НА РУССКОМ ЯЗЫКЕ:
Встроенный автопромптер ПРЕКРАСНО понимает запросы на русском языке! Вы можете писать простые действия прямо на русском — во время тестов никаких глюков или сбоев замечено не было. Тем не менее, если вы хотите получить максимальную точность физики от модели, можно использовать и английский язык.
🔥 ГЛАВНЫЕ ФИШКИ СХЕМЫ:
1. Умный Автопромптер (на базе Qwen2.5-Instruct) — автоматически превращает короткие фразы на русском в подробные технические сценарии движений тела, одежды и волос .
2. Никаких галлюцинаций камеры — настройки ИИ зажаты так, что он наглухо блокирует любые дёрганья, пролёты или зум камеры. Видео остаётся стабильным, а LTX идеально считывает внешность с вашего исходного кадра (если обратное движение камеры не указано вами в промпте напрямую).
3. Модульный пульт управления — с помощью ноды Fast Groups Bypasser можно в один клик временно отключать блоки генерации или апскейлер для экономии времени и ресурсов.
4. Встроенный видео-апскейлер — на выходе вы получаете не размытый исходник LTX, а чёткое, увеличенное в 2 раза качественное видео с плавными 24 FPS.
⏱️ ВАЖНОЕ ОГРАНИЧЕНИЕ ПО ДЛИТЕЛЬНОСТИ:
Безграничное удлинение: Этот модульный процесс полностью снимает базовые лимиты модели LTX-2.3 (которая стандартно выдает лучшие результаты на коротких отрезках в 5–10 секунд).
Бесшовная склейка: Благодаря последовательной генерации и автоматической склейке кадров, вы можете легко создавать цельные простые (!) ролики длиной до 30 секунд и более за один проход.
Масштабируемость: Итоговый хронометраж ограничен только мощностью вашего железа. Вы можете свободно добавлять новые блоки генерации в схему, чтобы продлить видео на любую нужную вам длину.
Этот генератор не является профессиональным, но он показывает отличную стабильность до 10 секунд на один блок. Сама модель LTX обучалась в основном на отрезки в 5–10 секунд. Если вы выставите длительность больше 10 секунд для одного шага, стабильность не гарантируется — видео может начать сильно «плыть». Для создания длинных видео просто добавляйте новые последовательные блоки по 5–10 секунд.
⚠️ ВАЖНО ПЕРЕД УСТАНОВКОЙ (Для кастомных нод):
Поскольку в схеме используются сторонние кастомные узлы для автоматизации (Multimodal LLM / GGUF), для их корректной компиляции и сборки зависимостей в системе ОБЯЗАТЕЛЬНО должен быть установлен официальный пакет инструментов Microsoft Visual Studio:
🔗 Скачать Visual Studio: https://microsoft.com
(При установке обязательно выберите галочку "Разработка классических приложений на C++"). Также не забудьте докачать необходимые .gguf модели текстовых генераторов через ComfyUI Manager.
💻 СИСТЕМНЫЕ ТРЕБОВАНИЯ:
Для комфортного запуска и стабильной генерации видео вашей системе необходимы следующие характеристики:
Видеокарта (VRAM): Минимум 8 ГБ видеопамяти.
Важно: Если в процессе генерации возникают ошибки нехватки памяти (Out of Memory), просто снизьте разрешение исходных картинок.
Оперативная память (RAM): Минимум 16 ГБ. Принцип простой: чем больше объем ОЗУ, тем стабильнее работает сборка.
Накопитель (ROM): От 512 ГБ свободного места. Крайне рекомендуется использовать быстрые SSD (NVMe), чтобы модели загружались без задержек.
Операционная система: Windows 10 или Windows 11.
Программная среда: Обязательно наличие актуальных драйверов NVIDIA CUDA для полноценного ускорения вычислений на GPU.