NoobAI-XL Quality Slider
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
このモデルは「品質」を向上させます
ここでいう「品質」は、私が使用したトレーニングプロセスによって定義されています。このプロセスでは、多数の異なる構図に対して、モデルの「名作」タグおよび他のさまざまなタグを強化しました。
どのように実現したのですか?
私は、GitHub上のP1atdevがLECO論文に基づいて作成したLECOトレーニングスクリプトを使用してこのモデルをトレーニングしました。LECOトレーニングプロセスは、任意のノイズ除去強度で画像を生成し、その後、概念をプロンプトとして与えた場合と与えない場合のモデル出力の差異を用いて学習します。これにより、モデルはタグ、単語、概念、または文句を任意のプロンプトに割り当てることが可能になります。この場合、私は
masterpiece, best quality, newest, absurdres, highres, high quality, highly detailed
という「品質の段落」を
割り当てました。つまり、私はモデルを、常に「品質の段落」がプロンプトとして与えられたかのように画像を生成するようにトレーニングしたのです。
寄付について
トレーニングの話になりますが、モデルのトレーニングは高コストです。私は自分のプライベートサーバーでトレーニングを実行しています。私の取り組みを気に入っていただけたら、開発を支援していただけると幸いです!
主な利点
このアプローチの最も好きな利点の一つは、「品質」をモジュール化し、制御可能にできることです。「品質」タグの重みを増やすと出力にやや謎めいた影響を与えますが、このLoRA/LECOでは、LoRA/LECOの重みを調整することで、変化の強さを明確かつ理解しやすく制御できます。これは意図された操作です(一方で、重み付きプロンプトはアテンション層に適用されるハックであり、常に望ましい効果をもたらすわけではありません)。
もう一つの利点は、このLoRA/LECOが「品質の段落」に使われるトークンを消費しないことです!コンテキストウィンドウを消費すると、A1111、InvokeAI、ComfyUIなどのバックエンドがアテンションに見えないBREAKを挿入することになり、構築中のプロンプトの全体的な整合性を損ない、他の予期しない影響をもたらす可能性があります。
特徴
多くのケースでテストしましたが、私が繰り返し観察したのは以下の点です:
- 未指定の場合、人物が女性的になる傾向があります。
- 重みが高いほど、「シャープ」な見た目になるようです。
- 構図に大きな影響を与え、以前の生成結果を単に改善したい場合には不適切です。
- 画像の露出が増加する傾向があるようです。
- モデルが何らかの形でより信頼性が高まったように思われます。CFGスケールをベースモデルの動作範囲より上下に設定しても、通常の動作が回復する傾向があり、これは不思議です。










