Karmix-XL v0
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
Karmix-XL v0
Karmix-XL v0 は、SDXL(Epsilon-Pred)を基盤とする実験的なアニメ風テキストから画像へのモデルです。高解像度潜在空間のサポート、スタイルの柔軟性、Danbooruタグから自然言語まで多様なプロンプト構造の解釈能力に焦点を当てています。

さまざまなプロンプトによるモデルの能力を示すサンプル画像。
注:これらの結果は、Hires.fix、AfterDetailer、Inpaintなど一切適用していない生のテキスト2画像出力です。ポートレート解像度は1280x1856、ランドスケープは1536x1024です。
使用ソフトウェアはComfyUIであり、アップロードされた画像にはワークフローが画像のメタデータに含まれています。
モデルの説明
このモデルは、Karcher Mean 結合手法を使用して作成され、win10ogod が開発したスクリプトの改変版を特に関係しています。
モデルは、1536x1536ベース(Illustrious-XL 2.0)、1536+1024ミックス(Illustrious + NoobAI)、および1024x1024ベース(NoobAI 1.0を基にしたOD39_E60トレーニング済み)の複数モデルを結合したものです。
ソースコード:
この結合に使用された改変版ソースコードは以下で公開されています:
https://github.com/chemwolf118/Karcher-merge
結合レシピ(v0)
以下のアルファ比率を使用して結合を行いました:
モデルコンポーネント | 比率(アルファ)
hesperidesIllustrious_v10 | 0.23
illustriousXLPersonalMerge_v30Noob10based | 0.23
illustriousXL20_v20 | 0.23 | CivitAI版
OD39_E60_fp16 | 0.31
詳細パラメータ:
このモデルは karcher-iter 30 および karcher-tol 1e-7 で結合されました。各層の重みは以下の通りです:
--alphas 0.23 0.23 0.23 0.31
--alphas-te 0.28 0.18 0.18 0.36
--alphas-unet-in 0.15 0.24 0.15 0.46
--alphas-unet-mid 0.15 0.24 0.15 0.46
--alphas-unet-out 0.28 0.18 0.18 0.36
使用方法と推奨事項
重要: このモデルは実験段階("v0")です。解像度、サンプラー設定、使用するアーティストタグによって挙動が異なる場合があります。
解像度とサンプラー
このモデルは高解像度潜在生成(最大1856px)をサポートしています。
テスト済み解像度: 1280×1856、1856×1280、標準的な 1024x1536、1536x1024。
注:場合によっては1536x2048や2048x1536も可能ですが、非常に稀であり、すべてのプロンプトで安定して動作するわけではありません。
🚧 モデルの制限とパフォーマンスに関する注意
このモデルは1280x1856で直接生成可能ですが、このような高解像度での生成品質には制限と特徴があります。
NoobAIをベースにした複数のモデルが混合されているため、NoobAIは1024ベースであり1536ベースではないため、middle finger/full bodyなどのタグを使用すると、タグ・ポーズ・角度によって解剖学的な形が伸びる場合があります。
また、Eulerサンプラーを使用したランドスケープ方向で解剖学的構造が崩れるという既知の問題があります。
使用ケース | 推奨サンプラー | スケジューラ | 備考
ポートレート | Euler | Normal | 一般的に良好に動作します。
ランドスケープ | DPM++ 2M または 3M | sgm_uniform | 重要: 高解像度ランドスケープ(例:1856x1280)でEulerを使用すると、解剖学的構造が崩れることがよくあります。
推奨設定
解像度 / アスペクト比 - ポートレートアスペクト比:1024x1536–1280x1856、ランドスケープ:1536x1024
CFG - 3.5–5(推奨:4.0–4.3)
ステップ数 - 28–30
サンプラー - Euler
スケジューラ - Normal
プロンプトスタイル
Karmix-XL v0は柔軟で、複数のプロンプト構造をサポートしています。以下のようにスタイルを組み合わせて使用できます:
1. Danbooruタグ
標準的なタグベースのプロンプト。
> 1girl, solo, cat_ears, maid, white apron, smile, looking at viewer, indoors
2. 自然言語
標準的なSDXL使用法と同様の記述文。
> このアニメは、夜にバルコニーの手すりに寄りかかる、長い黒髪の大人の女性を描いており、背景には都市の灯りが見える。
3. 混合:自然言語 + アーティストタグ
シーンは自然言語で、スタイルはタグで指定。
> 白髪で赤い目を持つ美しいアニメの少女、複雑なドレスを着たシーン。 artist:konya_karasue
4. 複雑な混合
すべての方法を組み合わせられます:
> 森を背景にした戦士の少女のシネマティックなショット。 1girl, armor, sword, holding weapon. yao liao wang,xilmo, (fkey:0.5), meinoss,dikko
プロンプティングの注意:アーティストタグに特定のニックネーム(例:tanti_men_(dragon) が突然ドラゴンを生成、chuck_(harfmoondark) が chuck_(pokemon) を生成するなど)を使用して不要な「生物」や「物体」が画像に現れる問題が発生した場合、そのタグには "artist:" を付けて使用することをお勧めします。例:artist:chuck_(harfmoondark)。
バージョン履歴
v0 - 2025年4月23日作成、2025年4月28日 HuggingFace にアップロード | リンク
- 初期リリース。
v0-CivitAI - 2025年12月5日アップロード
その他のバージョン
異なる結合手法/パラメータを持つ他の実験的バージョンは以下で確認できます:
https://huggingface.co/NullAxis/karmix-merge-experiments
(注:これらのバージョンはプロトタイプであり、今後の主要リリースの最終品質を反映したものではありません。)
NullAxisは、Karmixおよびさまざまなモデル融合手法の実験を目的として設立された組織であり、現在ウェブサイト nullaxis.devを運営しています。 既存の作品や今後の計画などの活動情報は、ここに公開されます。
謝辞
このプロジェクトを可能にした貢献者および開発者に心より感謝します:
su momo — Karcher-mergeスクリプトの改善、アドバイス、支援の主な貢献者。
win10ogod — Karmixの作成に使用されたKarcher-merge手法スクリプトの作者。GitHub | HuggingFace
乙酰胆碱 — Karmixで使用された美しいOD39_E60モデルの作者。
DammK YaZuXaWa — win10ogodによるKarcher-merge手法の情報源およびプロセス中のさまざまな支援。GitHub | HuggingFace | CivitAI
Kurosu Chan — Karmixの初期記事に関する質問の対応および評価支援。GitHub | Gist | HuggingFace
Stable Diffusion CN — SDCNコミュニティ全体に特別な感謝を。
Laxhar Lab — NoobAI XL への貢献
OnomaAI — Illustrious XL への貢献
bloodsplash — Hesperides XL v1.0 への貢献 | CivitAI
dims2 — Illustrious XL personal merge v3.0 への貢献 | CivitAI
その他 — コミュニティのサポートおよびテスト
初期記事はアーカイブされ、今後の情報はHuggingFaceのモデルカードに記載されます。
ご質問、提案、フィードバックがございましたら、HuggingFaceでディスカッションを作成するか、メールでご連絡ください: [email protected]。
ライセンス
このモデルは Fair AI Public License 1.0-SD(Illustriousライセンス) の下でリリースされています。
また、NoobAI 由来のコンポーネントも含まれており、それには独自の使用条件があります。以下の両方のライセンスに準拠してください:
Illustriousライセンス条件: https://freedevproject.org/faipl-1.0-sd
NoobAIライセンス条件: https://huggingface.co/Laxhar/noobai-XL-1.0/blob/main/README.md#model-license







