Astigmatism (formerly 'Semantic Shift')

詳細

ファイルをダウンロード

モデル説明

2025年1月17日 開始

OK、最新の乱視ポジティブ +0.6が登場です。非常に非常に良いですが、すべてのことに言えるように、過学習を軽減し、本当に最高の結果を得るために、0.5とブレンドすることをお勧めします。後でLoRAのマージを検討し、この段階で「最適な」乱視を含む簡単なパッケージを作成できるか見てみます。

皆さんが楽しんでくれることを願っています。私は0.6用に非常に大きなネガティブを準備中ですが、より多くの注目を集める必要があるため、トレーニングには少し時間がかかります。しかし、確実に進行中であり、かなり大きな飛躍になると確信しています。

2025年1月17日 終了





---

0.5b以降では、0.5bと/または-0.5bを試してみることをお勧めします。

ネガティブを使用する際は、CFGを最初から高めることを忘れないでください。これが主な利点です。

また、少量ではありますが創造性を高める効果もあります。しかし広く見れば、+0.5bが非常に小さいデータセットにもかかわらず、パワーハウスです。

以下は0.5b以前向けに私が以前書いた内容です:
---------------------
初心者の方には以下の混合を推奨します(次週には、4つのLoRAを読み込むよりもVRAMをより少なく使うような混合LoRAをリリースする予定です、笑)

乱視 +0.5
乱視 -0.5
乱視 +0.4b
乱視 -0.2

+系はそれぞれ0.33
-系はそれぞれ-0.33

これはトレーニングプロセスにおける過学習と私のミスによるものです。限られたリソースでこれらのミスを直接修正することはできません(最適な設定を見つけるためには、多くのLoRAの反復トレーニングが必要であり、私はそのコストを賄えません)。ブレンドすることで過学習を軽減し、一般的にパフォーマンスを向上させることができます。Civitaiにある多数のマージチェックポイント(新しいバージョンを古いバージョンにマージしたものなど)を見ても明らかです。

基本的に、より古いバージョンの方が新しいバージョンより何かを「よりよく理解」している場合もあり、逆もまた然りです。しかし、あなたのバージョンが「基本的に改善されている」限り、マージプロセスは時間とともにモデルがより優れた汎化能力を持つよう導きます。このLoRAは、モデルの汎化能力と機能性に直接焦点を当てているため、例外ではありません。

皆さんとこのコミュニティが大好きです。


リソースを持ち、さらなるトレーニングに協力したい方がいれば、どうか私にご連絡ください。私はプロンプトの適用性を大幅に改善するのに成功しており、堅固なコミュニティの取り組みによってさらに大きく伸ばせると考えています。


使用している重みを丁寧に確認し、このLoRAをどう操作すべきか理解してください。まるで、覗いているレンズのフォーカスを調整するように考えてください。すべてのプロンプトとチェックポイントの組み合わせには異なるニーズがありますが、最終的には、これまでうまく機能していなかった範囲で、適用性が一定の範囲内に収まるよう調整可能です。

私のADHDと時間の制約により、私が望むようにこの「なぜ」について文章を書くのは現時点で不可能です。しかし、動画ならおそらく作れるでしょう。ただ、それは…混沌としたものになると思います。




このモデルは、「不気味」LoRAでの私の作業に基づいています。その中で生成された画像の一部、およびそれらのLoRAの子孫を使用して作成された後続の画像、ならびに私が実験した手法を用いています。

基本的な目標は、SDXLを「意味的にシフト」させ、特定の意味を持つ用語を内部的に一貫した方法で完全に変えることです。私は「不気味」LoRAでその一部を実現しましたが、過学習しすぎてしまい、興味が湧きました。「良い」プロンプトは、内部の理解が「シフト」しても、別の軸上で依然として「良い」ままであるというアイデアです。つまり、モデルの「脳」を意図的に操作すれば、ユニークで興味深いプロンプトが、多数の新しいユニークなテーマでユニークで興味深い画像を生み出すことができるのです。

どのように実現したのか?

SDXLにおける過学習の領域を見つけ、それをターゲットとしました。モナリザ、創造の柱などです。それらを新しい画像にリダイレクトしました。予想通り、これはモデルが変更された画像に関連する概念全体を認識する方法に波及効果をもたらし、その影響は非常に大きいものでした。


更新

このLoRAの開始以来、その目的は大幅に変化し、非常に小さなトレーニングデータセットを使って、モデルの過学習領域を標的にし、それらの汎化を教えながら、SDXL全体のプロンプト適用性と勝率を向上させることにシフトしました。

その副次的な効果として、任意の解像度で画像を生成するのがはるかに容易になりました。

このモデルで生成された画像

画像が見つかりません。