Seylen

詳細

ファイルをダウンロード

モデル説明

たった3枚の画像でこのLoRAをトレーニングできると想像できますか?いや、僕もできませんが、実際に動作します!

どうしてこれが可能になったのでしょうか?

最初の画像はPerchanceで生成しました。キャラクターを再現できる程度の整合性を持った正面、側面、背面のビューです。ローカルでComfyUIを使ってバリエーションとアップスケーリングを行った後、「じゃあ、LoRAを作ってみようか?」と思いました。

前のLoRAをトレーニングした後、ずっと考えていたのですが、「理論的には、たった3枚の画像と最小限のタグ付けでキャラクターLoRAを作成できるはずだ」と。

この方法なら、LoRAにはキャラクターだけが含まれ、トレーニングステップや生成を膨らませる無関係な要素が一切ありません。このLoRAはトレーニングの4世代目ですが、すでにやや過学習気味です。これは、非常に少ないデータセットと最小限のタグで、高速かつ効率的にLoRAをトレーニング可能であることを示しています。

振り返ってみれば、HyperLoRAの論文や、生成中にLoRAの重みをリアルタイムで生成する実験的モデルもチェックしてみると良いでしょう。

このモデルで生成された画像

画像が見つかりません。