CatWai (merge)
詳細
ファイルをダウンロード
モデル説明
明確にしておきます:これはイプシロン予測モデルです。ただし、マージに使用されたモデルの一部はV予測です。
このチェックポイントのマージは、高品質を保ちつつ、V予測モデルcatTowerNoobaiXLをイプシロン予測形式に適応させたものとして位置づけられています。V予測モデルを実行できる場合は、ぜひこちらもお試しください : )
v1.5はcatTowerNoobaiXL_v15VpredとwaiNSFWIllustrious_v90を基に構築されています。
v1.4はcatTowerNoobaiXL_v14VpredとwaiNSFWIllustrious_v70を基に構築されています。
v1.0_fixはcatTowerNoobaiXL_v11VpredとwaiNSFWIllustrious_v70を基に構築されています。
これは私の初めてのチェックポイントマージで、V予測モデルをイプシロン予測モデルに変換する実験的な試みです。
主にcatTowerNoobaiXL(V予測)を基に構築され、最終的なマージはイプシロン予測形式で行われており、バニラWebUIで使用できます。
これは出力層を段階的に他のイプシロン予測モデルに置き換えることで実現しました。置き換えに選んだモデルは(90% waiNSFWIllustrious + 10% ebara_pony_2.1)です。変換後のモデルはさらにwaiNSFWIllustriousと9:1の割合でマージされ、ざっくり言うと約70% CatTower + 28% wai + 2% ebaraという構成になります。これが「CatWai」と呼ぶ理由です。
マージはComfyUIで行いました。モデルファイルまたはJSONワークフローをComfyUIにドラッグすると、詳細なマージワークフローを確認できます。JSONファイルは「training data」としてアップロードされたzipファイル内に含まれています。これらの3つのモデルをディスクに保存している場合、ComfyUIワークフローを使うことで6GBのダウンロードを節約できます :) テキスト版のレシピも以下に記載します。
元のモデル作者の皆様、特に非常に優れた設計のcatTowerモデルに感謝します。このモデルのおかげで、再びAI絵画に興奮できるようになりました!このマージのライセンスはcatTowerと同様で、商業利用は禁止されています。
もともと、このモデルをcatTower向けのLoRAパッチとして公開しようと思いましたが、失敗しました。似たような結果は得られましたが、dim=conv_dim=512でも品質が著しく低下しました。
設定
私はIL / Noobの初心者なので、この設定が最適とは限りません。
ポジティブプロンプト:
masterpiece, best quality, absurdres, safe
ネガティブプロンプト:
lowres, worst quality, low quality, bad anatomy, bad hands, 4koma, comic, greyscale, censored, jpeg artifacts, overly saturated, overly vivid
サンプリング手法:Euler
サンプリングステップ:30
解像度:個人的には1024 x 1536を推奨しますが、多くのユーザーは832 x 1216を使用しています。
CFGスケール:5
Clipスキップ:2
レシピ
v1.4は、catTowerNoobaiXL_v11VpredをcatTowerNoobaiXL_v14Vpredに置き換えた同じワークフローを使用しています。
v1.5は、catTowerNoobaiXL_v11VpredをcatTowerNoobaiXL_v15Vpredに、waiNSFWIllustrious_v70をwaiNSFWIllustrious_v90に置き換えた同じワークフローを使用しています。
モデルファイルまたはJSONワークフローをComfyUIにドラッグすることで、詳細なマージワークフローを確認できます。JSONファイルは「training data」としてアップロードされたzipファイル内に含まれています。
A = 0.9 * waiNSFWIllustrious_v70 + 0.1 * ebara_pony_2.1
B = x * catTowerNoobaiXL_v11Vpred + (1 - x) * A
ここでxはoutput_block 0-8およびその他の出力ブロックに対して[1.0, 1.0, 1.0, 0.7, 0.5, 0.25, 0.1, 0.0, 0.0, 0.0]、その他のブロック(input_blocks + mid_blocks + その他)ではx = 1.0です。
result = 0.9 * B + 0.1 * waiNSFWIllustrious_v70
ライセンス
ライセンスはcatTowerと同様:商業利用は禁止されています。




















