Kohaku XL beta

150万枚の画像で学習されたアニメ向けSDXLモデル。

注意: 追加の実験により、beta7が一般的にbeta7proよりも優れていることが示されました。beta7proにはモザイクアーティファクト（beta7よりも顕著）が生じやすく、beta7はテキストと画像の整合性がより優れています。そのため、モデルの順序を再編成しました。

はじめに

このモデルは、[Kohaku-XL alpha](Kohaku-XL alpha - nyan | Stable Diffusion Checkpoint | Civitai)を基に、150万枚の画像で再学習し、他のモデルとマージして作成されました。

使用方法の詳細

このモデルは解像度に対して非常に柔軟で、sd1.x/2.xで使用していた解像度（例：512x768）で通常の結果を得られます。また、SDXLに適した解像度（例：896×1280）や、それ以上の解像度（1024x1536もテキスト→画像生成に問題なく使用可能）を使用できます。

アニメスタイル向けのおすすめネガティブプロンプト：

photorealistic, 3d model, bad, worse, worst, ugly, bad anatomy, blurry, close-up, disembodied limb
photorealistic, text, icon, artist name, signature, twitter username, naked, nude, monochrome, blurry, bad anatomy, watercolor, oil painting
watercolor, oil painting, photo, deformed, realism, disfigured, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry

学習詳細

Kohaku-XL beta5

このモデルは、IDが5,000,000〜6,600,000のNew-Danbooru画像（148万枚）を使用して学習されました。
Kohaku-XL alpha7から継承し、NekoRayXLとマージして作成されました。

Kohaku-XL base4（未公開）

このモデルは、IDが5,000,000〜6,600,000のNew-Danbooru画像（148万枚）を使用して学習されました。
SDXL-0.9から継承（SDXL-1.0には微調整に悪影響を与えるいくつかの問題があるため）。計画では、このモデルを2エポック（約94,500ステップ）で学習する予定です。

現在、この事前学習済みモデルは公開していません。

Kohaku-XL beta7

base4とbeta5をマージし、次の式で計算されます：

beta(5+n) = beta5 + (n/4) * (base4 - sdxl0.9)

したがって、beta7は beta5 + 0.5 * (base4 - sdxl0.9) です。

Kohaku-XL beta7.1 (7pro)

beta7と同じですが、完成したbase4を使用し、重みを0.25に設定しています。

注：ここで使用するbase4は50kステップ版です！

今後の計画

base4の学習完了後、Mynefactoryデータセット、またはCyberMeow(alea31415)/Narugo1992のレジデータセットでさらに学習を実行します。

謝辞

モデル

NekoRayXL

モデルタイプ	チェックポイント
ベースモデル	SDXL 1.0
公開日	10/21/2023

Kohaku-XL beta

詳細

ファイルをダウンロード

このバージョンについて

モデル説明