wan2.2_5B_lora_lab

詳細

ファイルをダウンロード

モデル説明

■これは、wan2.2_5B LoRAのための私のテスト環境です。

■私のLoRAは主に静止画像で学習されており、T2I → I2Vワークフローでwan2.2_5Bと組み合わせて使用されることを目的としています。
これらは単一の概念に焦点を当てるのではなく、幅広い未知の概念を学習することに重点を置いています。

■wan2.2_5Bの主な特徴は、5Bパラメータを有しながらも軽量で効率的であり、トレーニングと推論の両方が軽負荷である点だと思います。

■このモデルは動画トレーニングの実用的な選択肢として特に有望であり、静止画像のトレーニングも軽量で使いやすいです。
T2VとI2Vを一つのモデルに統合しているため、コンパクトで優れています。アーキテクチャは品質と効率の間で素晴らしいバランスを実現しており、その可能性に強く感じます。未知の概念のトレーニングも非常に簡単です。

■wan2.2_5Bを初めて使用する場合、必要なモデルとワークフローは以下のURLから取得できます——ぜひお試しください。

https://comfyanonymous.github.io/ComfyUI_examples/wan22/

■各LoRAの詳細な説明はタブに記載されています。ワークフローも含まれているため、推論の参考にお使いください。

■私のテストでは、1920x1728や1280x1728などの高解像度でも静止画像の推論は非常に安定しており、ほとんど問題なく動作しました。これはモデルの柔軟性の高さを示しています。このため、私のワークフローのデフォルト解像度は1920x1280pxです。縦長の解像度でも良好な結果が得られますが、動画に近い横長アスペクト比の方がより魅力的だと感じました。

■このモデルはテクスチャなどの細部表現にも非常に優れていますが、VAE特有のアーティファクトが若干存在します。SD1.5などのモデルを用いてi2iで修正するのは良い選択肢です。wan2.2_5Bが構図の印象を担当し、別のモデルが細部を洗練させれば、結果はさらに良くなります。

私のワークフローには、以下に示すモデルを用いたi2iも含まれていますので、参考にしてください。リアルストイルとアニメスタイルの両方が用意されていますので、お好みで選んでください。もちろん、VRAMに余裕があるなら、SDXLも非常に優れた選択肢です。

/model/1246353/sd15modellab

■私はAI Toolkitを使ってLoRAをトレーニングしました。トレーニングに興味がある場合は、開発者が作成したチュートリアルをご覧ください。予想以上に簡単であることがわかるでしょう。

このモデルで生成された画像

画像が見つかりません。