Chef's Astral Vision v0.6
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
こんにちは、シェフたち!
このモデルの使い方に関する完全なガイドとヒントを読むには、下の「もっと表示」をクリックしてください。
私はPromptnanimousで、Chef’s Astral Visionは私の3番目のミックスモデルです。
このモデルは、以前のモデルであるChef's Basted Breastsをベースにしたミックスです。Chef’s Astral Visionは、現実的な構成と非現実的な細部を組み合わせた「2.8D」的なセミリアルなモデルです。
私のガイドやモデルをお気に入りいただけたら、ぜひ私をフォローしたり、友人にモデルをシェアしたり、ko-fiで一杯コーヒーを買っていただけると幸いです。今後、さらに多くのモデル、ガイド、サンプル画像を公開する予定です!
Chef’s Astral Visionのサンプル画像
展示用画像のほとんどは、txt2imgとhires. fixを使用して、LoRAやネガティブ埋め込みなしで作成されています。一部の画像では、特定のプロンプトに少しスタイルを加えたり、特定の要素を制御したりするためにLoRAやネガティブ埋め込みを使用しています。これは、結果をさまざまな方法で調整できる可能性を示すためです。全体的に、このモデルは埋め込みなしでも非常に優れた性能を発揮しますが、良いネガティブ埋め込みを選択することでプロンプトをさらに強化できます。実験はあなたの味方です!
以下は、私の観察に基づいたこのモデルの特性です。私が挙げた内容よりも優れている、または劣っていると感じるかもしれません。どちらにせよ、ぜひ教えてください。学び、改善したいと思います!
強み:
セミリアル—「写実的」「描画」などの特定のスタイルをプロンプトに指定しなくても、このモデルはわずかにセミリアルな傾向を持ち、写実的な構成に強く傾いており、整然とした、ほぼ快適な不気味な谷効果を生み出します。
美しい女性
スタイルの融合
色彩
時間帯
静物
抽象的な細部—写実主義に強く傾いているにもかかわらず、「野生的」な非常にクールな細部を得ることができます。BREAKやさまざまなスタイルプロンプトを使用した例は、展示画像をご覧ください。
それなりにうまくいく:
写実主義—epiCRealLife Enhancer LoRAのようなものを使用すると、この方向に導くことができます。写実主義に優れた他のモデルは多数存在しますが、このモデルでも良い結果を得られます。
Danbooruトークン
描画・イラスト—一部のプロンプトでは非常に優れた結果が得られます(個人的には、白黒のマンガなど)。ただし、アニメやイラストのプロンプトに対して完全な2Dスタイルに移行することを拒否します。ただし、そのおかげで、よりセミリアルな結果との素晴らしいスタイル融合が可能になります。
アーティストのスタイル—BREAKトークンに続けて、影響を受けさせたいアーティストを指定することで、アーティストのスタイルを融合させることができます。
レトロアニメ(私は「1990年代アニメ」というプロンプトを使って、良い結果を得ています)
ポーズ(より良い結果を得るには、常にControlNetを使用できます)
NSFWアクション(専用のLoRAや埋め込みが必要な場合がありますが、結果は個々に異なります)
弱み:
手—神様、このモデルが生成する手はひどいですよね :( 次のバージョンでは、この不具合を修正するためにトレーニングを試みます。
- (好きなプロンプトを見つけたら、good hands beta lycorisを追加できます)
物を保持する
私が得た結果と似た結果が得られない場合、以下のことを試してみてください:
画像のメタデータに記載されている設定と、あなたの設定が完全に一致していることを確認してください。VAE、Clip Skip、アップスケーラー、デノイジング強度、トークン組み合わせ設定などを含みます。
意図せず追加の拡張機能やアドオンを使用していないか確認してください。ControlNetが有効になっていないかなどです。
セットやキャラクターの細部を変更しながら「スタイル」を維持したい場合は、プロンプトトークンの順序をあまり変更しないでください。プロンプトの最小限の編集で、キャラクターや設定の詳細を変えて、スタイルを保ったまま似た画像を得ることができます。
顔が主な違いである場合、私がadetailerを使用した画像を選んでいる可能性があります。そのため、adetailerを有効化する(まだインストールしていない場合はまずインストール)し、画像のメタデータに記載されている追加のadetailer設定をコピーしてください。
私はxformersを使用しているため、同じシードを使用していても、わずかな細部については生成結果が決定論的ではありません。画像がほぼ同じで、ごく小さな違いしかない場合、これが理由です。これはxformersの仕様であり、修正できません。
上記のどれも効果がない場合は、メッセージを送ってください。できる限りお手伝いします。
頻繁に使用する生成設定
特定の結果を再現するには、サンプル画像をガイドとしてご利用ください。モデルを全体的に探索する際は、以下の生成設定を使用し、必要に応じて調整してください。
新しいプロンプトアイデアを素早く試すための、スピードとクオリティのバランスの取れた設定:
VAE: vae-ft-mse-840000-ema-pruned.safetensors
Clip Skip: 1
サンプラー: UniPC または DPM++ 2M Karras
ステップ数: 35 - 40
高さ: 512
幅: 768
CFG: 6~8の範囲
hires. fix: はい(ただし、詳細の鮮明さを犠牲にしてスピードを優先したい場合は「いいえ」に設定できます)
hires ステップ数:20 または 25
デノイジング強度:0.45 - 0.55(どれだけ急いでいるかによります—少しでも速くしたい場合は低めに設定)
拡大率:1.5
アップスケーラー:Latent(bicubic antialiased)または 4x_fatal_anime_ 500000_G または 4x_foolhardy_Remacri または 4x-UltraSharp
最高クオリティ(ただし遅い)を求める場合(上記設定で良質な結果のバッチを見つけた後に使用します):
VAE: vae-ft-mse-840000-ema-pruned.safetensors
Clip Skip: 1
サンプラー: DPM++ SDE Karras
ステップ数: 25
高さ: 512
幅: 768
CFG: 6~8(一部のプロンプトでは、不都合なアーチファクトなしでより印象的な効果を得るために、より高めに設定できます)
hires. fix: はい
hires ステップ数:20
デノイジング強度:0.45–0.55(0.45に近いと「柔らかい」印象、0.55に近いと「シャープ」な印象)
拡大率:2
アップスケーラー:Latent(bicubic antialiased)または 4x_fatal_anime_ 500000_G または 4x_foolhardy_Remacri または 4x-UltraSharp
ランダムなヒント
前述の通り、私は反復実験用と高品質画像のバッチ生成用に異なる設定を使用します。スピードとクオリティのトレードオフがあります。ゆっくり実験するのは良くありませんが、50%以上が目的の結果になると判断した場合は、バッチの生成を待つのは気にならないです。
また、必要に応じてgood hands beta lycorisやdetail tweaker LoRAを追加することもあります。LoRAは生成速度を遅くするため、特定のLoRAの機能を試す場合を除いて、反復実験中は使用しないようにしています。
このモデルで良い結果を得るには、ネガティブTIは基本的に必要ありませんが、私は頻繁にそれらを使用しており、非常に優れた結果を生み出します。人物を含む写実主義の方向に進める際には、CyberRealistic NegativeとSkinPerfection Negative v1.5を組み合わせるのが好きです。また、verybadimagenegative v1.3、bad-hands-5、aid28、badv5、deformityv6、bad_pictures、bad-picture-chill-75vなど、さまざまな組み合わせで使用しているネガティブTIが他にもあります(見落としているものもあるかもしれません)。
もし、ネガティブTIに「en_」という文字が含まれている場合、これはまだ公開されていないカスタムネガティブTIのセットです。需要があれば、作成者に公開を勧めたり、私が代わりに公開したりするかもしれません。
生成結果を一般的に向上させるには、(worst quality:1.5)、(low quality:1.5)、(normal quality:1.5)を使用してください。
色を制御したい場合、ネガティブプロンプトに“greyscale”を追加し、注意度を調整してください。
より興味深い結果を得るために、ネガティブに“symmetry”を追加してください。私は注意度を1.3に設定するのが好きです。
被写体の体重を制御したい場合、ネガティブまたはポジティブに“plump”を追加してください。
「カウボーイショット」を狙う場合、結果が近すぎたら、ポジティブプロンプトに“hips”を追加してください。“cowboy”は、“denim”や“hat”などのカウボーイ的要素を導入する「汚染された」トークンです。使用しないでください。他の多くのモデルでも同様です。
画像に被写体全体を収めたい場合は、ポジティブプロンプトの先頭に“full body”を追加してください。
顔の特徴—すべて同じ顔に見える結果が出ている場合、自分が気づいていないトークンの影響で顔の形状が固定されている可能性があります。これを解決するには、顔の特徴を「ロックイン」しているトークンを特定し、プロンプト編集でそれらのトークンの影響を遅らせる(例:[token:0.3])しか方法がありません。
上記のことはLoRAにも当てはまります(プロンプト編集の部分はLoRAには適用されません)。LoRAは、意図した以上の影響を結果に与えることがあります。生成結果に意図しない特徴が現れ、ネガティブプロンプトで改善できない場合、使用しているLoRAが原因かもしれません。LoRAによっては、その望ましくない特徴を「修正」できない場合もあります。
プロンプトのトークン数はできるだけ少なく保つようにしてください。必須ではありませんが、役立ちます。多くのトークンを使ってもとてもクールな結果を得られますが、バランスを取るのが難しくなり、トークンが75個ずつUnetにバッチ送信されるチャンキングロジックの影響で、トークン数が増えれば増えるほど、予期せぬ方法で結果が大きく変わることがあります。
私について
私は約14ヶ月間、StableDiffusion v1.5モデルとAutomatic1111を毎日使用し、その間に6万枚以上の画像を作成してきました。その中で、素早い反復を通じてプロンプト技法や設定について学んできました。
私の専門分野は、img2imgやインペイントなどの他の手法を使わず、txt2imgとhires. fixのみでSD1.5モデルの最高の結果を得ることです。高品質な画像を生み出すための優れた設定を見つけることで、シンプルで効率的なワークフローを実現できるのが好きです。また、LoRAは生成速度を遅くするため基本的には避けていますが、特定のスタイルを実現したり、good hands betaやdetail tweakerのようなフィクサーLoRAを使用する場合は使います。
私のガイドやモデルをお気に入りいただけたら、ぜひ私をフォローしたり、友人にモデルをシェアしたり、ko-fiで一杯コーヒーを買っていただけると幸いです。
今後、さらに多くのモデル、ガイド、サンプル画像を公開する予定です!




















