【Art Style】Hiten

詳細

ファイルをダウンロード

モデル説明

2023.9.20

Lohaスタイルでの訓練におけるalphaの影響を調査し、同時に1つのモデルを訓練しました。

結論:alpha値が低いほど、モデルは画面上の要素をより概念化する方向に学習します(また、スタイルに軽微な影響が観察されましたが、これがランダムな誤差によるものかは不明です)。さらに、低alphaでは出力時に元の画像要素をできる限り保持し、画面の調和をあまり考慮しなくなるため、モデルはプロンプトに対してより敏感になります。一方、alpha = dim の場合、完全にLohaを基準に画像を生成し、画面内の不調和な要素を削除してよりクリーンな画像を出力するため、高alphaではモデルのプロンプトに対する敏感度は低くなり、むしろ「良い画像」を生成する方向に傾きます。

例えば、このスーツケースの上に座っているドレスの女の子の画像では、alpha値が低いモデルを使用した場合、女の子は手にカードを保持しているだけでなく、背景にもカードのフレームが付加されます:

alphaの設定については人それぞれの見解があります。低すぎると、副次的なプロンプトに対してAIが過剰に解釈し、実際の使用が煩雑になります。逆に高すぎると呼び出しは容易ですが、プロンプトへの従順性が低下します。具体的な設定は訓練目標次第です。ここでは、alpha値の高いバージョンをアップロードしていますので、使用しやすいです。

2023.8.30

204枚の画像を使用し、オプティマイザにはprodigyを採用しました。

このアダプティブオプティマイザは、パラメータの変更が多すぎて学習率の計算が乱れる問題を完璧に解決し、私のような調整が苦手な怠け者にとって最適です。強く推奨します。複数回の試行の結果、大きなデータセットとバッチサイズでスタイルを訓練する際には、2つの学習率をともに1に設定し、coefを2に設定するのが最良の結果を得られました。

その他のパラメータは特に変更せず、ピラミッドノイズを使用し、モデルの汎化性を向上させるために最小SNRガマ値を5に設定しました。出力モデルにはすべてNAIとeasynegativeを使用しています。

このモデルで生成された画像

画像が見つかりません。