WAN2.2 T2V for 8GB-VRAMlets!
詳細
ファイルをダウンロード
モデル説明
🎬 テキスト入力から8秒間、480×480ピクセルの動画を、平均的なゲーム用PC(VRAM 8GB、RAM 32GB)でたった≈5分で生成! 🎮⏱️
動画生成の高速レーンへようこそ! ここでは、平均的なゲーム用PCでたった≈5分で短い動画を作成します…つまり、動画クリップを生成するのに十分なVRAMはありますが、小さな町を動かすには明らかに足りません。
あなたはWAN2.2-14B-Rapid-AllInOne-GGUFモデルを活用します。これは、テキストから動画(T2V) と画像から動画(I2V) を1つのモデルで実現する、高速かつ最適化されたソリューションです。強力なWAN 2.2 14Bモデルを基盤とし、軽量なGGUFフォーマットを使用して、消費者向けハードウェア上でスピードと効率(FP8精度)を最適化しています。
💡 より多くのLoRasやより高い解像度は、より多くの(V)RAMを必要とします。メモリ割り当てエラーが発生しましたか?単にフレーム数(リゾリューションノード内の**「length」**値)を減らすだけです!
必要なもの
AllInOne GGUFモデル Hugging Face - WAN2.2-14B-Rapid-AllInOne-GGUF
--> 例はこちらを使用
エンコーダー GGUF Hugging Face - umt5-xxl-encoder-gguf
