Muscular Women - Wan

詳細

ファイルをダウンロード

モデル説明

動画の女性主人公に筋肉を追加します。このLoRAはWan 2.1とWan 2.2の両方で良好に動作します。このLoRAは、0.25から4.0以上まで強度スライダーのように扱えますが、高値には以下で説明するデメリットがあります。

更新: 最良の結果を得るには、私のワークフローをお試しください。このワークフローは、私が自分のモデルですべての動画を作成する際に使用しているもので、Wan 2.1で作成されたLoRAをWan 2.2で使用しても優れた結果を生み出します。

バージョン2

このテキストの大部分はバージョン2に対応して書き直されています。モデルの動作に変更が多すぎたため、変更点をバージョンノートにのみ記すのは不適切でした。バージョン1をご利用の方は、再度この注意書きをお読みください。役立つ情報が含まれている可能性があります。

重要: このモデルは100%フィクションであり、実在の人物の画像を基にしていません。モデルのデータセットは静止画像のチェックポイントから生成され、その後AIレンダリングのみを使用して進化させています。実在の人物の画像(実物またはAI生成のいずれも)は、このモデルの作成に一切関与していません。

キーフレーズは「筋肉質な女性」、すなわち「筋肉質な女性が公園を歩いている」というような文脈です。

  • 0.25 - 0.75:定期的に運動する、やや筋肉質に見えるスポーツ体型の女性
  • 0.75 - 1.50:定期的にトレーニングやウェイトリフティングを行う、明らかに筋肉質な女性
  • 1.5以上:ボディビルダー級の筋肉量ですが、3.0以上になると体にやや過飽和が生じます。

過飽和や動きの劣化を避けつつ、より良い結果を得るにはプロンプトのヒントを使用できます。Wan 2.2はこのLoRAに対してプロンプトの記述を非常に良く尊重します。単純な変更として「極めて筋肉質な女性」と言うだけでも効果がありますが、より詳細に指定することも可能です。ただし、Wanで「ボディビルダー」という言葉を使うのは避けてください。この言葉は、得られるポーズや動きに影響を与える可能性があります。Wanはボディビルコンテストやポージングについて理解しており、プロンプトにこの単語を含めると、動画にその影響が現れます。また、Wanはシーンの文脈を理解していることに注意してください。たとえば、シーンがウェイトリフティングを行うジムである場合、同じプロンプトとシードをレストランで使用した場合よりもはるかに筋肉質な結果になります。

このモデルは多少ですが胸のサイズも増加させますが、大幅な変化ではありません。胸のサイズをより大きく変更したい場合は、プロンプトと追加のLoRAを組み合わせると効果的です。この筋肉質なLoRAは他のLoRAと良好に連動します。

最後にプロンプトのヒントを一つ。Wan 2.2の分割モデルパイプラインでは、高ノイズと低ノイズに異なる値を設定でき、異なる結果を得ることができます。高ノイズパイプラインの変更は、動画全体の動きやシーン内の人物・物体の全体的な形状に影響します。一般に、高ノイズパイプラインで非常に高いLoRA値を用いると動画の動きが劣化するため避けてください。低ノイズパイプラインの変更は、動画の最終的な外観と細部に影響します。ここでは値を上げることで、動きを変えずにLoRA効果を強化できますが、過飽和が起きやすい場所でもあります。

私の経験では、このモデルは約2.00までが、動きと過飽和の変化がほとんどなく最適です。4.00(高・低ノイズとも)まで上げても、自然な動きと明確な細部が得られます。低ノイズパイプラインでさらに高値にすると、画像が崩れ始めます。より極端な効果を得たければ、高ノイズ値を5.00以上に上げ、低ノイズ値を1.5または2.0程度に保つことで、結果は明確で過飽和が少ないまま得られます。

私のサンプル動画には、各動画で使用した強度値をラベルとして表示しています。ご自身で値を調整し、お望みの外観を得るまでお楽しみください。

バージョン2 LoRA学習に関する注意点: バージョン1を頻繁に使用するうちに、顔の過飽和にイライラするようになりました。このバージョンでは、同じ約200枚の画像データセットを使用しましたが、ComfyUIのノードを使ってすべての顔を透明な長方形で自動的にマスク処理しました。髪の毛はそのまま残り、画像の他の部分は一切変更していません。キャプションはすべて非常にシンプルで、バージョン1で発見したバイアスに対抗するためにわずかにバリエーションを加えました:

筋肉質な女性のポートレート。彼女の顔は補正されています。(彼女は腰に両手を当てている。)(両手は拳を握っている。)

最後の2文はオプションで、必要な画像にのみ追加しました。私のデータセットの画像の多くが、拳を握り腰に手を当てたボディビルダーのポーズを含んでおり、出力動画にそのバイアスが強く現れていました。バージョン2ではこの問題は見られません。驚くべきことに、私は20エポック中たったの3エポック目を公開しています。キャプションは限られており、データセットは広範囲でしたが、Wanがこのモデルをどれほど迅速かつ強く学習したかに驚きました。このような低エポック数で、LoRAを使用しない場合と同様に、シーンの動きやその他の細部を非常に良く保持しているように見え、これは素晴らしい兆候です。すべてのサンプルを公開した後、LoRAをまったく使用しない状態から4.0以上まで、同じクリップとプロンプトで変化を示すシリーズ動画を投稿します。

強い女性の姿をぜひお楽しみください。

このモデルで生成された画像

画像が見つかりません。