Feet Up

詳細

ファイルをダウンロード

モデル説明

バージョン2.0の更新:

満足していませんが、少なくともバージョン1.0よりはましです。このLoRAは、靴またはストッキングが含まれる71枚の画像と、素足の43枚の画像から構成されるデータセットで作成されました。ハイヒールは他の靴よりもうまく機能し、素足も問題ありません。完璧ではありませんが、4枚の画像のバッチから1~2枚ほど、まあまあの品質の画像を生成できます。私は、自分のハードウェアと利用可能な画像の範囲内で、できるだけ多くのアプローチを試しました。おそらく、信頼性高く動作させるには、さらに数百枚の画像と約100エポックが必要だと推測しますが、それは私の範囲を超えています。


このLoRAは非常に難解でした。私は、人物がお腹を下に向けて横たわり、足を空中に上げた画像を生成しようと試みました。しかし、Fluxは足の処理にまったく苦労しています。素足はそれほど悪くありませんが、靴はまったくダメです。

いくつかのサンプルセットとアプローチを試しました。たとえば、ランク32、93枚の画像、300エポックの組み合わせも試しました(4060Tiで2.54枚/秒の速度なので、どれだけ時間がかかったか計算できます)。さらに悪いことに、たとえうまくいったとしても、画像全体に歪みが広がってしまいました。私は、LoRAが顔に影響を与えないように、以前から画像を下半身と足だけに裁断していました。最後の試みは、ランク4と100エポックだけでしたが、これの方がはるかにうまく機能しました。

この開発とテストの過程で、私はおそらく、生きた整形外科医よりも多くの変形した足を見てきたことでしょう。それでも、これでやっとまともに動作するレベルです。靴には約0.9の強度が必要ですが、素足にはそれよりずっと低く、0.5程度で十分です。残念ながら、どの方向にずれているのかを判断するのは難しいです。脚や足、足裏が奇妙な場所に多く現れる場合は、強度を下げてください。靴が大きすぎると、それも問題ですが、変形した靴の場合は強度が弱すぎます。

私は「足を上げる」「脚を上げる」「足裏が見える」というテキストで学習させました。なぜなら、問題の一部は、通常は見えない足裏に関するデータが欠けていることにあると感じたからです。

このモデルで生成された画像

画像が見つかりません。