Kohaku-XL beta
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
Kohaku XL beta
150万枚の画像で学習されたアニメ向けSDXLモデル。
注意: 追加の実験により、beta7が一般的にbeta7proよりも優れていることが示されました。beta7proにはモザイクアーティファクト(beta7よりも顕著)が生じやすく、beta7はテキストと画像の整合性がより優れています。そのため、モデルの順序を再編成しました。
はじめに
このモデルは、[Kohaku-XL alpha](Kohaku-XL alpha - nyan | Stable Diffusion Checkpoint | Civitai)を基に、150万枚の画像で再学習し、他のモデルとマージして作成されました。
使用方法の詳細
このモデルは解像度に対して非常に柔軟で、sd1.x/2.xで使用していた解像度(例:512x768)で通常の結果を得られます。また、SDXLに適した解像度(例:896×1280)や、それ以上の解像度(1024x1536もテキスト→画像生成に問題なく使用可能)を使用できます。
アニメスタイル向けのおすすめネガティブプロンプト:
photorealistic, 3d model, bad, worse, worst, ugly, bad anatomy, blurry, close-up, disembodied limbphotorealistic, text, icon, artist name, signature, twitter username, naked, nude, monochrome, blurry, bad anatomy, watercolor, oil paintingwatercolor, oil painting, photo, deformed, realism, disfigured, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry
学習詳細
Kohaku-XL beta5
このモデルは、IDが5,000,000〜6,600,000のNew-Danbooru画像(148万枚)を使用して学習されました。
Kohaku-XL alpha7から継承し、NekoRayXLとマージして作成されました。
Kohaku-XL base4(未公開)
このモデルは、IDが5,000,000〜6,600,000のNew-Danbooru画像(148万枚)を使用して学習されました。
SDXL-0.9から継承(SDXL-1.0には微調整に悪影響を与えるいくつかの問題があるため)。計画では、このモデルを2エポック(約94,500ステップ)で学習する予定です。
現在、この事前学習済みモデルは公開していません。
Kohaku-XL beta7
base4とbeta5をマージし、次の式で計算されます:
beta(5+n) = beta5 + (n/4) * (base4 - sdxl0.9)
したがって、beta7は beta5 + 0.5 * (base4 - sdxl0.9) です。
Kohaku-XL beta7.1 (7pro)
beta7と同じですが、完成したbase4を使用し、重みを0.25に設定しています。
注:ここで使用するbase4は50kステップ版です!
今後の計画
base4の学習完了後、Mynefactoryデータセット、またはCyberMeow(alea31415)/Narugo1992のレジデータセットでさらに学習を実行します。
謝辞
モデル








