Snakebite
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
これは、いくつかの最も優れた現実的なIllustriousモデルとbigASP 2.5を組み合わせた実験的なチェックポイントです。うまくいきました。
アップデート: v2.0がこちらで利用可能! あなたがこれまで試したことがないようなモデルであることを保証します。
❤️ Snakebiteが気に入った場合は、トレーニングコストの一部を補填するのにご協力ください:
なぜ重要なのか
bigASPはプロンプトの忠実度が優れていますが、スタイルや構図に関しては極めて不安定です。潜在能力が未開拓のベースモデルのように感じられます。適切な設定を調整することは、ルービックキューブを解くようなものです。
一方、Illustriousモデルは3D化する際に多くの概念を失ってしまいます。比較的ポピュラーなbooruタグを使っても、当たり外れが激しいです。しかし、これらの重みの照明と構図は依然として👌です。
私は両者の長所を組み合わせられるかどうかを試してみたところ、意外と可能であることがわかりました。重要なのは丁寧なブロックマージです。bigASPのoutput_blocks.0を注入することで、その概念的知識の大部分を取得できます。middle_block.2を追加すると、解剖学的な問題(余分な腕や指が生じるなど)が軽減されます。
初期印象
これまでに見た中で、リアルなSDXLモデルの中で最も優れたプロンプト忠実度。いや、エロだけではなく(特にエロには強い)。
booruタグと自然言語の両方と互換性があります。混合プロンプト方式が最適だと考えています。私はプロンプトで約70%をタグ(アンダースコアなし)、30%を自然言語で使用しています。
bigASPのスタイルタグ(例:masterpiece quality や 35mm)を一定程度理解しています。
まったく新しい何かを感じさせ、探求する価値があります。bigASPを軽視しないでください!
欠点
Illustrious 2.0モデルは、解剖学的なひどい歪み(例:長猫型の胴体)なしに1024x1440や1024x1536の解像度をサポートしますが、bigASPの最適解像度は832x1216のみです…Snakebiteではそれ以上に上げないことをお勧めします。上げた場合、解剖学的な部分はほぼ問題ありません(驚異的です)が、画像の構図が非常に奇妙で不快になります。
我々は新しい不思議な潜在空間にいるため、既存のLoRAはあまりうまく機能しません。しかし、再学習する価値はあります。
推奨設定
Turbo版は推論に適しています。非常に高速で、やや改善された美的品質を持ちます。非Turbo版は微調整に有用で、25ステップ以上待つことに耐えられるなら、美しいテクスチャを生成できます。
Turbo
8または9ステップ
LCMサンプラー
CFG 1
下記のカスタムシグマ、または単純な
Full
20〜28ステップ
Euler ancestralサンプラー
CFG 3〜4
下記のカスタムシグマ、または単純な
カスタムシグマ曲線(comfyui-kjnodesを使用して適用できます):
15, 8, 4, 2, 2, 1, 0.4, 0.2, 0
四肢が変形する場合は、シグマ曲線の最初の数値を調整することで画像を救済できることがあります。以下は特定のプロンプトに対してより安定したバージョンです:
14, 5, 2, 2, 2, 1, 0.4, 0.2, 0
それでも「ボディホラー」が発生する場合は、以下の品質タグを試してください(正のプロンプトに負の重みを適用するにはComfyUI-ppmが必要です):
masterpiece quality, realistic photo, (worst quality,:-1) (mutated,:-1)
Snakebiteはスタイル用語に非常に敏感です(IL基準では特に)。余分な「装飾」は最小限に抑えましょう。試したほぼすべてのトークンが画像に大きな影響を与えます。
最後に、CLIPAttentionMultiplyノードを試すことをお勧めします。qとvパラメータを上げると、画像がより「Illustrious風」になります:クリーンで安定しますが、現実的ではなく、プロンプト忠実度も低くなります。両方の値を3に設定すると非常にクリーンな画像になります。
BIGASPのCLIPが利用可能に!
バージョン1.3以降、SnakebiteにはbigASPのCLIPが一部含まれており、より多くのスタイルプロンプトを利用できます。さまざまな用語を試して、効果を確認してください。個人的にはシンプルに保ちます。これにより、副作用なく画像が改善されます:
high quality, sharp focus
どのバージョンを選ぶべき?
どのモデルバージョンを選ぶべきか迷っている場合、以下が要約です:
v1.4 = 次世代のリアルさ、圧倒的なテクスチャ、非常に安定、以前のバージョンよりやや彩度が低く、非写実的画像の生成能力はやや劣る
v1.3 = 良い解剖学、良い背景、良い一貫性
v1.2 = 最もパワフルな色合い
v1.1 = bigASPからの影響が最大(CLIPを除く)、色が地味、正直失敗した実験
v1.0 = 印象的な創造性を示すが非常に不安定
モデルが気に入った場合、またはさらに微調整に使用した場合は、ぜひ教えてください!結果を見せてもらいたいです。💪











