HunyuanVideo POV Missionary

詳細

ファイルをダウンロード

モデル説明

例のプロンプト:
ミッションリーセックス、女性が背臥位で脚を開き、男性と性交している様子を天井から見下ろすPOV。彼女はソファーに横たわっており、快楽のあまり呻いている。画面の下部では、男性が陰茎を素早く彼女の膣内に挿入し、前後に突き刺している。カメラは引き気味で安定して撮影されている。彼女の赤銅色の髪は長く、カールしている。

バージョン1.2の更新:
前回と同じトレーニング動画を使用しましたが、今回は顔をぼかしました。これにより、顔を変更しないバージョンが完成したと希望しています。実際、キャラクターロラとの相性が明らかに良くなり、顔のバリエーションも若干改善されたように見えます。

トレーニング動画の顔をぼかすために、https://github.com/ORB-HD/deface を使用し、キャプションに「顔が規制されぼかされた女性」と追加しました。

バージョン1.1の更新:
新たにいくつかの動画をトレーニングに追加し、動きそのものにもっとズームインして、より正確に学習できるようにしました。また、学習率を5e-5に下げ、繰り返し回数を30に増やしました。

結果として、低強度でより良く動作するようになり、キャラクターロラとの親和性も改善されたように思われます。

このトレーニングには8時間かかりましたが、v1.0では1.5時間でした。良い結果を得るための最適な学習率とトレーニング時間のバランスがあるはずですが、それを特定するにはさらに多くの実験が必要です。

トレーニングに使用した具体的なmp4ファイルを共有するのは、オンラインサイトから単にダウンロードしただけであり、配布する権利を持っていないため、快く思えません。ただし、設定ファイルとキャプションのトレーニングデータは公開し、他の人がトレーニングを始めやすくなるようにします。意外と迅速で簡単だったことに驚きました。

トレーニングデータのダウンロードには、複数のLoRAと上手く連携させるためのワークフローの例を含めました(ワークフローをアップロードする他の方法が見つかりませんでした)。これにはダイナミックプロンプトのサポートも含まれています。

v 1.1:
3090 GPUを使用し、11本の3秒間の動画(24fps、各50フレーム以上)でトレーニング。20エポック、30回繰り返しで約8時間かかりました。

v 1.0:
3090 GPUを使用し、8本の3秒間の動画(24fps、各50フレーム以上)でトレーニング。20エポック、10回繰り返しで約1時間30分かかりました。

このモデルで生成された画像

画像が見つかりません。