Wan 2.2 A14B I2V GGUF UPUP
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
V1.1(BETA)
普段通りウェブを閲覧していたところ、ふと非常に目を引くモデル[こちら]を見つけました。紹介を確認したところ、非常に優れていると感じましたが、一つ懸念がありました。これはFP8モデルであり、私の4060 GPUで処理できるか不安でした。さらに、単一モデルのサイズが19GBという点で、さらに緊張しました。「試してみよう」という気持ちで試したところ、このモデルは非常に強力であることがわかりました。写実的な画像はまだ試していませんが、アニメスタイルには特に優れており、VRAM使用量はQ8 GGUF形式と同等、あるいはそれ以下で、処理時間も同様です。
したがって、条件が許すなら、このモデルを絶対に試すことをお勧めします。非常にクールな体験が得られるでしょう。従来のGGUF形式と比較して、この新モデルは詳細とスタイル変換においてより正確で強力であり、トレーニング範囲も広く(NSFWコンテンツを含む)ため、画像生成の品質が大幅に向上しています。
CLIP Visionが追加されています。その機能が正確に何なのかはまだ完全には理解していませんが、構図やカメラワークをモデルに教える役割があるようですね。いずれにせよ、コンテンツが欠落する問題は発生しません。(これは無意味であると確認しました。削除可能です。)
モデルにはすでに内蔵の加速効果が組み込まれているため、外部からLIGHTX2 LORAを手動で追加する必要はありません。
「最初の4フレームをカット」機能を追加しました。これは動画出力時に最初の4フレームを切り取るものです。モデルの問題により、多くのWAN I2Vモデルはこの欠点を抱えています。入力画像のスタイルが強い場合、モデルはより主流なスタイルに移行しがちです。そこで、変化が最も激しい最初の4フレームをカットしてこの問題を回避しました。この機能は任意で有効化できます。
V1.0
このワークフローはWAN2.2 A14B I2V GGUFです。無限動画やループ再生などの特別な機能は含まれていません。単に最適化されたワークフローです。
このワークフローには以下のオプションがあります:
- 2段階デコード
- VRAMの最適化
- Sage Attention
- カラー修復
- x2アップスケーリング
- フレーム挿入
- プロンプト音声とVRAMのクリア
これらの機能は「Function selection」セクションでオン/オフできます。
私は/model/1911157/wan-22-5b-i2v-workflowの作者のワークフローを大いに参考にしました。これはまさにそのA14Bバージョンと言えるでしょう。可能であれば、作者の作品もぜひご確認ください。
ただ、動画生成時に発生する可能性のある「汚れたフレーム」の問題はまだ解決できていません。もし解決アイデアがあれば、ぜひ私に共有してください。私が追加・修正する可能性があります。
こんにちは、私はまだ初心者で、まだ素晴らしい画像を生成したことはありません。このワークフローを使って優れた動画を生成された方は、ぜひ共有してください。