HunyuanVideo POV Missionary
詳細
ファイルをダウンロード
モデル説明
例のプロンプト:
ミッションリーセックス、女性が背臥位で脚を開き、男性と性交している様子を天井から見下ろすPOV。彼女はソファーに横たわっており、快楽のあまり呻いている。画面の下部では、男性が陰茎を素早く彼女の膣内に挿入し、前後に突き刺している。カメラは引き気味で安定して撮影されている。彼女の赤銅色の髪は長く、カールしている。
バージョン1.2の更新:
前回と同じトレーニング動画を使用しましたが、今回は顔をぼかしました。これにより、顔を変更しないバージョンが完成したと希望しています。実際、キャラクターロラとの相性が明らかに良くなり、顔のバリエーションも若干改善されたように見えます。
トレーニング動画の顔をぼかすために、https://github.com/ORB-HD/deface を使用し、キャプションに「顔が規制されぼかされた女性」と追加しました。
バージョン1.1の更新:
新たにいくつかの動画をトレーニングに追加し、動きそのものにもっとズームインして、より正確に学習できるようにしました。また、学習率を5e-5に下げ、繰り返し回数を30に増やしました。
結果として、低強度でより良く動作するようになり、キャラクターロラとの親和性も改善されたように思われます。
このトレーニングには8時間かかりましたが、v1.0では1.5時間でした。良い結果を得るための最適な学習率とトレーニング時間のバランスがあるはずですが、それを特定するにはさらに多くの実験が必要です。
トレーニングに使用した具体的なmp4ファイルを共有するのは、オンラインサイトから単にダウンロードしただけであり、配布する権利を持っていないため、快く思えません。ただし、設定ファイルとキャプションのトレーニングデータは公開し、他の人がトレーニングを始めやすくなるようにします。意外と迅速で簡単だったことに驚きました。
トレーニングデータのダウンロードには、複数のLoRAと上手く連携させるためのワークフローの例を含めました(ワークフローをアップロードする他の方法が見つかりませんでした)。これにはダイナミックプロンプトのサポートも含まれています。
v 1.1:
3090 GPUを使用し、11本の3秒間の動画(24fps、各50フレーム以上)でトレーニング。20エポック、30回繰り返しで約8時間かかりました。
v 1.0:
3090 GPUを使用し、8本の3秒間の動画(24fps、各50フレーム以上)でトレーニング。20エポック、10回繰り返しで約1時間30分かかりました。