Hunyuan Video / Wan LoRA training toolkit

詳細

ファイルをダウンロード

モデル説明

LoRA用のデータセットを準備するのは面倒な作業です。面倒くさがりな私は、このプロセスのできるだけ多くの部分を自動化しようと試みました。

まず、フォルダから動画を抽出し、そのフレームレートを指定した目標フレームレート(デフォルトはHunyuan用に24fps)に変換するワークフローを持っています。そのためには、元のフレームレートと目標フレームレートの最小公倍数(lcm)を計算します(例:30と24の場合は120)。次に、FILMを使ってその最小公倍数までフレームを補間し、その後、必要なフレームのみを残して目標フレームレートまで戻します。やや過剰な処理ですが、あなたのコンピュータが処理できるなら、いくつかの手間を省けます。

数学処理用にカスタムノードを作成しました。マネージャーで見つからない場合はこちらをご利用ください:https://github.com/EmilioPlumed/ComfyUI-Math

次に、フォルダ内の動画にキャプションを付与する別のワークフローを持っています。これはJoy Captioner alpha 2を使用して詳細な説明文を生成し、2つのwd14タグgerを使用して異なるポイントからタグを抽出するように設定しています。3つのキャプションそれぞれにスライダーが用意されており、動画のどの部分から説明文やタグを抽出するかを選択できます。その後、重複するタグを削除し、テキストを1つの.txtファイルにまとめます。

これらのワークフローは、ファイル名を連番でリネームする必要があります。

このモデルで生成された画像

画像が見つかりません。