BBC Ride Wan (2.2!)

Wan 2.2でデータセットを再学習しました。両方のLoRA（HighとLow）を必ず取得してください！
K3NKのワークフローで素晴らしい結果が得られています - /model/1824027/wan-22-t2v-i2v4-stepskijais-wrapper-workflowk3nk

アップデート 6.17

このLoRAを改善しようとしているうちに、T2Vバージョンをアップロードしていないことに気づきました。では、こちらです。お楽しみください！

-- -- --

私の2つ目のLoRAです。キャプション作成のアプローチに大幅な変更を加え、その結果、いくつかの良い改善が見られました。

このLoRAで作成したものをぜひ共有してください！より良いプロンプトを見たいです！

これは、WAN 14B I2Vを用いて、diffusion-pipeで480P/24FPSに正規化され、3秒にトリミングされた45本の動画で学習されました。ただし、T2Vモデルでもそれなりに動作し、それに基づくいくつかの例も含まれています。

私のキャプション作成アプローチ：

45本の動画を480P、3秒、24FPSにリサイズ。
各動画をComfyUI_Qwen2-VL-Instructに通して基本的な動画説明を生成しました。ただし、この方法ではNSFW要素を検出できません。LLMがその提案に「嫌悪」しているかのようだったので、同じ画像に対して数回試す必要がありました。:D
「お気に入り」のフレームを取得し、Joy Caption 2に通して、Qwenの説明とJoy Caption Twoのキャプションを手動で組み合わせて最終的な.txtファイルを作成しました。