BBC Ride Wan (2.2!)

詳細

ファイルをダウンロード

モデル説明

Wan 2.2!

Wan 2.2でデータセットを再学習しました。両方のLoRA(HighとLow)を必ず取得してください!
K3NKのワークフローで素晴らしい結果が得られています - /model/1824027/wan-22-t2v-i2v4-stepskijais-wrapper-workflowk3nk

アップデート 6.17

このLoRAを改善しようとしているうちに、T2Vバージョンをアップロードしていないことに気づきました。では、こちらです。お楽しみください!

-- -- --

私の2つ目のLoRAです。キャプション作成のアプローチに大幅な変更を加え、その結果、いくつかの良い改善が見られました。

このLoRAで作成したものをぜひ共有してください!より良いプロンプトを見たいです!

これは、WAN 14B I2Vを用いて、diffusion-pipeで480P/24FPSに正規化され、3秒にトリミングされた45本の動画で学習されました。ただし、T2Vモデルでもそれなりに動作し、それに基づくいくつかの例も含まれています。

私のキャプション作成アプローチ:

  1. 45本の動画を480P、3秒、24FPSにリサイズ。

  2. 各動画をComfyUI_Qwen2-VL-Instructに通して基本的な動画説明を生成しました。ただし、この方法ではNSFW要素を検出できません。LLMがその提案に「嫌悪」しているかのようだったので、同じ画像に対して数回試す必要がありました。:D

  3. 「お気に入り」のフレームを取得し、Joy Caption 2に通して、Qwenの説明とJoy Caption Twoのキャプションを手動で組み合わせて最終的な.txtファイルを作成しました。

このモデルで生成された画像

画像が見つかりません。