Nicholas Quail - SX-4 - Detailer (PRO) [Background & Character]
詳細
ファイルをダウンロード
モデル説明
以下は、基本的な生成物を素晴らしい芸術作品に変える私の個人的なワークフローです:NQ - SX-4 - Scene (PRO) および NQ - SX-4 - Char (PRO)。私は1つの検出器とディテールャーのみを使用し、モデルに非常に高解像度で残りの処理を任せることで、VRAMのコストを抑えながら驚異的なクオリティを実現しています。

ディテールチェーン
まず、原始画像を背景(シーン)ディテールャーに通します。これはSAM PERSON検出器 person_yolov8m-seg.pt をマスクの反転と組み合わせて使用しており、人物を検出し、その後マスクを反転させてキャラクター以外のすべてを再生成します。マスクとキャラクターのブレンドが完璧に調整されているようにしましたが、より高いクオリティと精度のために、基本的なvit_bバージョンではなく、人物用の sam_vit_h_4b8939.pth の使用を推奨します。基本的なvit_bでは十分な性能が出ない可能性があります。私はすべてをvit_h専用に最適化しています。ただし、心配はいりません。チェーンの適切な位置に複数のVRAM解放ノードを追加しているため、よりリソースを消費するvit_h検出に必要な3GBのVRAMは、その後すぐに解放され、実際の生成が始まる前にクリアされます。高品質な検出にVRAMを消費することはありません。このとき、実際のディテール処理に必要なすべてのMBのVRAMを確保できるよう、ハードウェア負荷の高い処理を実行します。クロップ領域はガイドサイズ2160pxでキャプチャされ、3070pxまでアップスケールされます。つまり、画像全体が高品質(約縦横2K)でキャプチャされ、その後背景のみがフル4K解像度にアップスケールされ、4Kで再生成されます。これにより、ディテールャーLoRAの有無にかかわらず、多くの美しいディテールが追加されます。詳しくは後述します。
原始画像(例)— 1152x1408解像度で生成

背景ディテールャー

* このプロセスは約10GBのVRAMを使用し、最終的なVAEデコード時に最大15.2GBに達します。これにより、VRAMオーバーフローや生成エラー、強制的なボックスデコードが発生せず、コントロールネットで必ず画像が破損する問題を回避します。スムーズなアップスケールを実現するためには、すべての処理をVRAM内に収める必要があります。現在のワークフロー設定では、16GB GPUにぴったり収まるように最適化されています。RTX 4080、RTX 5080 などに対応しています。問題が発生した場合は、スライダーでガイド値を少し下げたり、最大アップスケール解像度を下げてください。その場合、品質は低下します。16GB GPUではこの調整は必要ありませんが、12GBや8GB GPUでは少し下げることを検討してください。
次に、すでに背景ディテールされた画像をキャラクターディテールャーに通します。これは同じ検出器を使用しますが、マスクの反転は行わず、キャラクターとその周囲のピクセルバッファのみをアップスケールします。このバッファは、美しい背景が壊れないようにするために必要です。たとえば、ずれた線や不自然なブレンドなどが発生しないように、キャラクターの端部分に少し背景をキャプチャし、ノイズマスクを通して適切にブレンドすることで、AIがキャラクター周囲の状況を把握し、すでにディテールされた背景を壊さないようにします。多くの既定のディテール設定(標準ディテールやSEGSディテールなど)はこのプロセスを乱してしまいます。私はさまざまな色調と露出のショットを用いてすべてを調整し、約8割の確率でご希望の結果が得られるようになっています。
私の方法の利点は、ボディパーツなどの追加ディテールャーが不要であることです。SFWとNSFWの両方で機能します。4K生成時の特定のボディパーツのクオリティは、低解像度で生成された原始ディテールャーを用いた場合よりもはるかに高品質です。ただし、気に入らない部分があれば、アップスケール済みの画像をさらにディテールを向上させるための追加ディテールチェーンに通すことも可能です(これはすでにワークフローに含まれており、必要に応じて好きなディテールャーを読み込んでチェーンに挿入できます)。しかし、私はこれまでにこのプロセスを必要としたことはありません。あなたの選択次第です。
キャラクターディテールャー

* このプロセスは約8GBのVRAMを使用し、最大12.4GBに達します。VRAMオーバーフローやボックスデコードによる生成エラーは発生しません。前述の通り、16GB GPU用に最適化されています。
NQ - SX-4 - Scene (PRO) および NQ - SX-4 - Char (PRO) のワークフローは、ベースとなる NQ - Text Engine および NQ - Image Engine のワークフローと連携しています。これにより、まず望む内容を簡単に生成し、その後、オンラインやFanboxなどで見られるような美しい芸術作品レベルまでクオリティを向上させることができます。非常に簡単で初心者にも優しく、ボタン1つで魔法が起きます。前述の通り、SFWとNSFWの両方、さらに過剰な生成にも対応しています。
必須要素
ワークフローを読み込むと、ComfyUI-Manager を通じて必要なアイテムは自動ダウンロードされます。ただし、以下のパックが必要です。おそらく、すでにComfyUIでインストール済みでしょう。
ltdrdata/ComfyUI-Impact-Subpack
Fannovel16/comfyui_controlnet_aux
モデルとディテールャー
私はIllustrious、Pony、NoobAIなど、さまざまなSDXLベースのモデルとファインチューンを活用しています。お好みのモデルを選んでください。ディテールLoRAの有無にかかわらず、問題なく動作します。以下のディテールャーを推奨します:
ユニバーサル
Smooth Detailer Booster (NoobAI/Illustrious/Pony) - Smooth Booster v4
背景用
Detailer | Tool / Concept LoRA IllustriousXL - v1.0
Detailer IL - v2 | Illustrious LoRA | Civitai
人物用
👑✨ TrendCraft: The People’s Style Detailer 🚀⭐Noob/Illustrious Base 🎨 - v2.4I Illustrious 5/18
👑✨ TrendCraft: The People’s Style Detailer 🚀⭐Pony XL Base 🎨 - v2.0 - Pony XL 3/12
















