CitrineDreamMix
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
概要
CitrineDreamMix は、さまざまなスタイルで多様な題材を生成できる非常に汎用性の高いモデルです。アニメとリアルismの中間あたりのスタイルで、非常に詳細かつ美しく仕上げた画像を生成することが得意です。また、NSFW画像や性的なコンテンツに強く注力しており、Booruタグのサポートも備えています。
このモデルは、私が最も好きな2つのモデルの統合である AbyssOrangeMix3 (AOM3) と NeverEnding Dream (NED) に基づいています。それらの作品に関しては、いかなるクレジットや所有権も主張していません。
AbyssOrangeMix3 は、細かく描かれたアニメ調のイラスト画像を作成するのが得意ですが、細部が多すぎて現実離れしてしまう傾向があり、ややリアルから離れることがあります。一方で、架空のキャラクターおよびNSFWコンテンツについては非常に優れており、よりニッチなコンテンツにも対応できます。
NeverEnding Dream は、洗練され、リアルな画像を作成するのが得意ですが、細部をやりすぎずに単純化しすぎてしまう傾向があり、画像がやや平らで単調に見えることがあります。また、特に現実離れした要素を持つ特定の架空キャラクターやNSFWシナリオに対しては苦労することがあります。
CitrineDreamMix の目的は、AOM3 と NED のいいところを両方取り入れ、その中間を目指すことです。AOM3 よりもややリアルなスタイルを、NED よりもややアニメ調のスタイルに仕上げることで、大きな目などのアニメ調の身体的特徴を保ちながらも、リアルに近い正確で滑らかなディテールを維持できます。
以下に、CitrineDreamMix と AOM3、NED のスタイルの違いを示す例として画像を挙げています。さらに、例の画像にはより大きなサイズでの比較も含まれています。いずれのモデルもプロンプトキーワードでリアル志向やアニメ風に調整可能なので、シンプルなプロンプトにして、それぞれの通常のスタイルの違いを見せています。すべてのモデルは美しい画像を生成するため、好みや題材に基づく選択になるだけです。
モデル比較:
プロンプト
プロンプトに関しては、AOM3 と NED ともにBooruタグを学習済みであるため、Booruタグの活用を強くおすすめします。A1111を使用する場合、Booruタグの自動補完拡張機能 を使用することを強くお勧めします。これにより、タグの正確な書式を手軽に把握できます。
よりリアルなスタイルを出したい場合は、プロンプトに「realistic」を含めてください。アニメ調を強調したい場合は、ネガティブプロンプトに「realistic」を使用してください。差を明確に感じたい場合は、重み(weight)を高く設定する必要があります。
ネガティブプロンプトに関しては、bad_prompt_version2、EasyNegative、bad-artist、bad-hands-5 といった人気のネガティブエンベッディングを使用しています。しかし、それらの影響を十分に検証していないため、必ずしも必要とは限りません。
設定
免責事項:
私はStable DiffusionやAI画像の専門家ではないため、私のすべての提案は非常に大きな疑念をもって受け取ってください。これらは、私の限られたテストの中で最も効果的だった一部の設定にすぎません。設定は自由にあそんで、自分に最適なものを見つけてください。
サンプリング方法:
DPM++ SDE Karras が最も効果的だと感じました。その次は DPM++ 2M Karras、Euler a、Heun です。ただし、設定や望ましい結果によっては、ほぼすべての方法が同様に機能します。
サンプリングステップ:
私はいつも約20ステップを推奨していますが、10~30ステップの範囲であれば似たような結果が得られました。使用するサンプリング方法によって結果が異なる可能性があります。
CFG Scale:
私は通常7のCFG Scaleを使っていますが、5~9の範囲でもほぼ同一の結果が得られました。10以上になると、やや奇妙なアーティファクトや比例の乱れが生じることがあるため、あまりに高すぎないように注意してください。
CLIP Skip:
CLIP skip 2 の方が CLIP skip 1 よりやや優れた結果を生み出しましたが、どちらも十分に機能します。CLIP skip 1 はややリアル志向のスタイルを生み出しやすいように感じましたが、特にテストを多くしていないため、偶然の可能性もあります。
VAE:
私は Waifu Diffusion の kl-f8-anime2 VAE が一番気に入りました。したがって、ベイクされたVAEバージョンにはそれを使っていますが、標準の vae-ft-mse-840000-ema-pruned VAE も非常に優れています。orangemix VAE は私の場合には色がぼんやりした印象になるため、より現実的な落ち着いた色合いを求める場合に限り使用をおすすめします。
拡大処理:
すべての画像は、txt2imgの際のHires. fix設定を使用して2倍に拡大しています。
4x-UltraSharp インターポレータ(他にも多くのインターポレータがあります)がお気に入りですが、R-ESRGAN-4x+ やLatent系も非常に優れたオプションです。これは非常に個人の好みの問題です。
ノイズ除去強度(denoising strength)は0.5~0.6程度に設定していますが、使用するアップスケーラーと拡大率によって調整可能です。また、img2imgでSDアップスケーリングスクリプトを使用する場合は、0.2~0.3程度の低い値を使うことをおすすめします。
チェンジログ
2023年6月16日
- AOM3 と NED の最新版を使用する v2 モデルを追加。改良点および違いについては、バージョンノートを参照してください。
2023年3月11日:
- マージサイズの問題を修正した v1.1 モデルを追加。



















