Experimental LCM Workflow "The Ravens" for Würstchen v3 aka Stable Cascade
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
重要注意点:
このLCMワークフローは非常に実験的なものであり、すべてのプロンプトが正しく動作するわけではありません。生成結果が破損することもありますが、これは正常な現象です。このワークフローは、こうした問題をある程度克服するように設計されています。このワークフローを、SDXLやSD1.5とは異なる新しい画像生成方法として捉え、Würstchen v3アーキテクチャの新しい使い方を探求してください。
インストール方法:
公式Stable Cascade *.safetensorファイルを以下からダウンロードしてください:
Stage BとStage Cを「ComfyUI\models\checkpoints」に移動してください。
Cannyを「ComfyUI\models\controlnet」に移動してください。ダウンロードした「The Ravens Workflow v01.zip」アーカイブを解凍してください。
私はsd-perturbed-attentionカスタムノードを使用しています。私のバージョンを「sd-perturbed-attention-master」フォルダごと「ComfyUI\custom_nodes」に移動してください。あるいは、公式GitHubページからダウンロードするか、ご自身の方法でインストールしてください。「The Ravens Workflow.png」をComfyUIのウィンドウ内に配置してください。
ドキュメント:
Würstchen v3(通称:Stable Cascade)
"The Ravens" ワークフロー
v 0.1 壮大で無感動
過去数ヶ月にわたりWürstchen v3アーキテクチャについて得た知識とその使用経験を、この短いテキストに凝縮するのは難しいため、ここでは私の基本的なアイデア、実用的なヒントやテクニックに焦点を当てます。このワークフローをできるだけシンプルで使いやすく設計しました。
1. コンセプト:
私の全体的なアイデアは、LCMサンプラーとCascadeの潜在的ノイズがどのようにそれと相互作用するかにあります。LCMサンプラーは幾何学的なノイズパターンを生成し、これにより、生成物はクリーンな幾何学的形状、対称的な調和、低解像度でも鮮明なディテール、正しいテクスチャの形状、まっすぐで鋭い線(ほぼベクトルのように)を実現します。
2. 問題点:
しかし、特定のプロンプトでは、生成結果が破損し、ドット、線、白い斑点、歪み、ノイズパターンといったアーチファクトが発生します。これを克服するために、この3段階ワークフローを設計しました:「メインパス」「ハイレゾフィックス第1パス」「ハイレゾフィックス第2パス」。通常、このプロセス全体を経ると、アーチファクトは隠蔽され、または完全に消えます。3つの生成画像をすべてチェックして最良のものを選んでください。最後の画像は、あまりにも滑らかになりすぎる可能性があるためです。
3. サンプラー:
追加の2つのハイレゾパスは、解像度を上げるためではなく、問題を克服するためにあります。3段階すべてで異なるサンプラーとスケジューラを組み合わせることで、さまざまなプロンプトが正しく動作するようになります。
LCM-Simple — これがメインサンプラーです。すべての段階、特にハイレゾ第1パスと第2パスでは常にこれを使用してください。
Euler-Normal — 画像に重度のアーチファクトが現れた場合、このサンプラーを使用するタイミングです。まず「メインパス」の「Stage C」で試してください。効果があればそのまま継続し、効果がなければ「メインパス」の「Stage B」で試してください。その後、ハイレゾパスでも同様にサンプラーを連鎖的に変えて最適な組み合わせを探してください。
Euler-A-Karras — アーチファクトのない友好的なサンプラーですが、LCMサンプラーの効果はほぼありません。非常にノイズの多い画像を修正する際に使用してください。「メインパス」の「Stage C」から始め、同様に連鎖的に進めて最適なポイントを見つけ出してください。
Euler-A-Simple — どれも効果がない場合、画像がひどく乱れ、プロンプトに反応しない場合は、この古い純粋なCascadeサンプラーに戻ってください。通常「メインパス」の「Stage C」で使用すれば画像が修正されます。それでもダメなら、おわかりですよね。
すべてのサンプラーに異なるスケジューラを適用してみてください。それぞれが異なる効果をもたらします。
4. 解像度 \ 圧縮率:
解像度と圧縮率は、少しややこしい存在です。これは「二重の頭」の問題を修正するだけでなく、全体の構図とディテールにも影響を与えます。たとえば、圧縮率32で1024x1024のピクセルアートは、圧縮率64より小さな「ピクセル」を作り出し、スタイルを変化させます。
圧縮率32 — 768x768から1280x1280までのすべてのアスペクト比で動作します。
圧縮率48 — 1280x1280から1792x1792までのすべてのアスペクト比で動作します。
圧縮率64 — 1792x1792から2304x2304までのすべてのアスペクト比で動作します。
低解像度や異なるアスペクト比で圧縮率64を使用すると、興味深い結果が得られることがあります。通常、ハイレゾフィックスパスでは圧縮率を変更する必要はありません。常に32のクリアな外観を維持したいからです。
5. ステップ数:
いつものように、ステップ数が多いほど良いですが、最適なポイントがあります:
メインパス — Stage C:12–36+(最適は18)
すべてのハイレゾパス — Stage C:6–18+(最適は9)
すべてのStage B:6–12+(最適は6)
CFGスケールを高めすぎると、ステップ数も増やす必要があることを忘れないでください。
6. CFGスケール:
CFGスケールが高いほど、画像の変化が少なくなり、過度に明るくなり、燃えるような仕上がりになります。暗い画像を望む場合はCFGスケールを下げてください。プロンプトは高CFG値で顕著に強化されます。
Stage C — 0.8–18+(最適は2.5)
Stage B — 1.5のままにしてください。
7. ノイズ除去強度:
なぜかCascadeはノイズを非常に多く追加する傾向があります。そのため、0.1の強度値を維持するのが良いアイデアです。より小さな変更が必要な場合は0.05、強い変更が必要な場合は0.2や0.3+を使用してください。修正目的の最適値は0.1です。
8. ワードの重み:
現在、トークンの重み(例:(この単語:1.0))は機能しません。このような形式は避けてください。ほとんどの場合、燃えたような画像しか得られません。代わりに、重みを強くしたいトークンをプロンプトの最初に持ってくることで対応してください。
9. PAG:
この便利なツールは生成をディテールに集中させるために使用されますが、私は「アダプティブスケール」と「スケール」パラメータを調整することで、同じシードに対するバリエーションを追加するのに使っています。
10. 連絡先:
civitai.com/user/Temp または reddit.com/user/-Ellary- までご連絡ください。
では、上に戻ってワークフローを見つけ、デモプロンプトを実行してください。善き運を!
よくある質問:
- どうすれば協力できますか?
:Stable CascadeとWürstchenアーキテクチャについて広めてください。CivitAIやRedditで最も優れた生成結果を共有し、他の人にStable Cascadeの使い方を教えましょう。
- 「ハイレゾフィックスパス」の1つがぼやけた画像を生成します!
:「スケール倍率」の数値を調整してください。ノイズが整列している必要があります。
- 生成された画像は気に入ったけど、暗すぎます!
:「ハイレゾフィックスパス」の一方または両方のCFG値を上げてください。
- さまざまなモジュールを無効にするには?
:「HiRes Fix VAE ENC - R1」と「R2」— ハイレゾパスを無効にします。
「Image Size」— メインパスを無効にします。
「APPLY CN」— Control-Net Cannyを無効にします。
「CLIP-V CON - I1」と「I2」— Clip-Visionを無効にします。
- Img2Imgを使うには?
:1. 画像を「Load Image I1」に読み込みます。
2. 「Upscale Img2Img - to R1」を「HiRes Fix VAE ENC - R1」に接続します。
3. Img2Imgを使用する際は、通常「メインパス」を無効にします。
- Control-Net Cannyを使うには?
:1. 画像を「Load Image I1」に読み込みます。
2. 「APPLY CN」を有効にします。
- Clip-Visionを使うには?
:1. 画像を「Load Image I1」または「Load Image I2」に読み込みます。
2. 「CLIP-V CON - I1」または「CLIP-V CON - I2」を有効にします。
- VRAMはどれくらい必要ですか?
:8GB VRAM、16GB RAMで十分です。




















