LTXV-2 Image Audio to Video

PixelMuseAI

51

1.1K

ltxv-2 ツール

詳細

ファイルをダウンロード

このバージョンについて

モデル説明

このワークフローは、画像とオーディオトラックを入力としてビデオを生成します。

重要なお知らせ

ComfyUI、KJ Nodes、ComfyUI-GGUFを更新してください。過去数日で多くのコードが更新されました。

V2更新

ネイティブなComfyUIローダーを使用するように変更しました。KJローダーは一部の生成でノイズを発生させるようです。VAEには公式のLTX-2リリースを、拡散モデルGGUFにはKijaiのリリースを使用しています。入力としてオーディオファイルを読み込めるように変更しました。

ダウンロードするモデル

models/diffusion_models に配置

https://huggingface.co/Kijai/MelBandRoFormer_comfy/resolve/main/MelBandRoformer_fp32.safetensors?download=true

https://huggingface.co/Kijai/LTXV2_comfy/resolve/main/diffusion_models/ltx-2-19b-distilled_Q8_0.gguf?download=true

https://huggingface.co/Lightricks/LTX-2/resolve/main/ltx-2-19b-dev-fp8.safetensors

models/vae に配置

https://huggingface.co/Kijai/LTXV2_comfy/resolve/main/VAE/LTX2_video_vae_bf16.safetensors?download=true

https://huggingface.co/Kijai/LTXV2_comfy/resolve/main/VAE/LTX2_audio_vae_bf16.safetensors?download=true

models/text_encoders に配置

https://huggingface.co/GitMylo/LTX-2-comfy_gemma_fp8_e4m3fn/resolve/main/gemma_3_12B_it_fp8_e4m3fn.safetensors?download=true

（V2のワークフローでは不要）https://huggingface.co/Kijai/LTXV2_comfy/resolve/main/text_encoders/ltx-2-19b-embeddings_connector_distill_bf16.safetensors?download=true

models/loras に配置

https://huggingface.co/Lightricks/LTX-2-19b-IC-LoRA-Detailer/resolve/main/ltx-2-19b-ic-lora-detailer.safetensors?download=true

このモデルで生成された画像

並び替え

画像が見つかりません。