Wan - Taker POV Fellatio - I2V
詳細
ファイルをダウンロード
モデル説明
このモデルは、Nvidia A6000を使用して、Wan I2V 14B 720Pチェックポイントを用い、約30本の2秒間の動画(アナセックスのさまざまなポーズを24fpsで収録)を用いてdiffusion-pipeで学習されました。
一般的にはT2V Wanチェックポイントで学習することが慣例ですが、このデータセットでT2VおよびI2Vの両方を試した場合、極めて悪い結果が出てしまいます。私の仮説では、Wanは他の行動と比べてこのような行動に対してあまり認識していないのかもしれませんが、確信は持っていません。ただ、T2Vでこのモデルを何度も学習試行しましたが失敗し、他のデータセットではT2Vでの学習に成功していることは確かです。
