nftest
詳細
ファイルをダウンロード
モデル説明
NoobAIのファインチューニング版。RTX 3060を使用し、1エポック完全と1エポック部分的に学習。このスクリプトを使用。データセットは、手動で収集し、WD EVA02-Large Tagger v3で自動キャプション付けした約4000枚の多様なアニメ風アート画像。
テキストエンコーダーは固定し、UNetのみを学習。conv1とconv2層はスキップ。これにより、過学習を抑えながら既存の特徴を強化。主な改善点は背景とアートスタイル。
学習のベースとして、既存の2つのファインチューニングモデルのマージを使用:LS Tiro 3.0、Seele 2.1、および未公開のNoobAI。これらをcomfy-mechaを用いてベースモデルに対して幾何平均を取った後、両結果のコサインAを0.69の比率で加算。VAEはファインチューニング済み:Luna。メモリ効率の高いRavenAdamWの提供に感謝します。Hysocs様。








