WAN2.2-14B T2V-T2I Prehistoric <-> Futuristic slider

詳細

ファイルをダウンロード

モデル説明

タイムトラベル用のテキストスライダー。

知っておくべきこと:
私はビデオ生成にWANを使用せず、画像生成のみに使用しました。ちなみに、ハイノイズLoRAはテストされていません。私は「ターボ」LoRA(*2)と一緒にローノイズチェックポイントのみを使用しています(動作した場合はコメントでお知らせください)。

Ostris AI-Toolkit を使用し、「低スペック」ハードウェア(*1) で作成しました。なぜなら、誰もが「不可能だ」と言っていたからです。

75ステップを維持しました。これは、25ステップから300ステップまで25ステップごとにテストした結果、最も良い結果を得られたからです。

推奨される最大強度は -7.5 / +7.5 ですが、他のLoRAやプロンプトに応じてさらに試してみてください。

強い正の値では人物が人形のように見え、強い負の値では小人のように見えることがあります。

編集:いくつかのコンセプトを試すための画像を追加しましたが、いくつかには満足していません(特に車両、風景、その他など)。v2の開発を進めています。

コメントをお待ちしています。


(*1):RAM 32GB、モバイルRTX4060(VRAM 8GB)搭載のノートパソコンで学習。

(*2)参考情報:T2I生成には、以下のLoRAの特定の組み合わせを使用しています(すべてのサンプル画像はこの組み合わせで作成):

これらはWAN2.1用のLoRAですが、過去のテストでは(少なくとも当時は)この組み合わせの方がより良い結果を出していました。

このモデルで生成された画像

画像が見つかりません。