Production Dual-Phase Refiner - LoRA Manager + Auto Metadata + Memory Optimized Workflow

DarthRidonkulous

119

ツール

SDXL_2PhaseSuperRef V1.2 SDXL_2Phase_Super_Ref V1

詳細

ファイルをダウンロード

このバージョンについて

ComfyUI 2-Phase Super Refiner V1.2 - 更新ノート

バージョン1.2リリース - 主要アーキテクチャ更新

これは、ワークフローの設定と操作方法を根本的に変える重要な更新です。V1.2では、制御を集中化し、各フェーズごとの高度な管理機能を追加する2つの強力なカスタムノードが導入されます。

📦 カスタムノードのインストール（必須）

重要： V1.2は機能するために2つのカスタムノードを必要とします。ワークフローを読み込む前に、これらをインストールしてください。

インストール手順

ComfyUIのcustom_nodesフォルダを特定してください：
- Windows: ComfyUI_windows_portable\ComfyUI\custom_nodes\
- Linux/Mac: ComfyUI/custom_nodes/
カスタムノードファイルをダウンロードしてください：
- sdxl_image_settings_controller.py
- multi_phase_prompt_manager_2phase.py
- これらのファイルはワークフローのダウンロードに同梱されています

両方のファイルをcustom_nodesフォルダにコピーしてください：

ComfyUI/custom_nodes/
├── sdxl_image_settings_controller.py
└── multi_phase_prompt_manager_2phase.py

ComfyUIを完全に再起動してください：
- ComfyUIを完全に閉じてください（単にリフレッシュしないでください）
- アプリケーションを再起動してください
- 完全な起動を待ってください
インストールを確認してください：
- ComfyUIのノードメニューを開いてください
- 「SDXL」カテゴリに「SDXL Image Settings Controller」が表示されているか確認してください
- 「conditioning/prompt」カテゴリに「Multi-Phase Prompt Manager (2 Phase)」が表示されているか確認してください
- 両方のノードが表示されれば、インストールは成功です

インストールのトラブルシューティング

再起動後もノードが表示されない？

ファイル名が正確に sdxl_image_settings_controller.py および multi_phase_prompt_manager_2phase.py であることを確認してください
ファイルがcustom_nodesフォルダ内に直接配置されているか確認してください（サブフォルダ内ではないこと）
起動時のComfyUIコンソールにPythonエラーがないか確認してください
ファイルが破損していないか確認してください（必要に応じて再ダウンロード）

ワークフローの読み込みに失敗する？

まず両方のカスタムノードをインストールし、その後ワークフローを読み込んでください
ノードをインストールした後にComfyUIを再起動したか確認してください
ワークフローを読み込む前に、ノードがノードメニューに表示されているか確認してください

🎯 新機能

2つの新しいカスタムノード（必須）

1. SDXLImageSettingsController - 集中型ワークフローコントロールハブ

3つの別々のノード（サブディレクトリ、シード、解像度）を統合した制御に置き換え
すべての生成設定を1か所で管理：
- サブディレクトリ/フォルダ構成
- 解像度プリセット（30以上のSDXL最適化比率）
- シード制御（固定/ランダム化/増加/減少）
- バッチサイズ管理
- フェーズ1 KSampler設定（ステップ、CFG、サンプラー、スケジューラ、denoise）
- フェーズ2 KSampler設定（ステップ、CFG、サンプラー、スケジューラ、denoise）
指定された解像度で空の潜在変数を自動生成
包括的なメタデータ要約を出力

2. MultiPhasePromptManager2Phase - 高度なプロンプト管理

複雑なプロンプト継承システム
フェーズごとのLoRAトリガー制御（クロスコンタミネーションを排除）
3つのフェーズ2モード：
- 「Use Base (Phase 1)」：フェーズ1のプロンプトを継承（一般的なリファイナー使用）
- 「Unique Prompt」：フェーズ2のプロンプトを完全に別物に
- 「Append to Base」：フェーズ1のプロンプトに追加テキストを付加
ウィルダーカード形式のsegs_labels対応
デバッグ用の設定要約出力

🔧 主な改善点

集中型制御

以前： 設定が3つ以上のノードに分散し、手動で調整が必要
現在： 1つのSDXLImageSettingsControllerですべてを管理 — フェーズ1とフェーズ2の解像度、シード、KSamplerパラメータを1か所で変更可能

フェーズごとのLoRA分離

以前： LoRAトリガー単語がグローバルに適用され、意図しない影響の可能性あり
現在： フェーズごとに独立したトリガー単語選択 — フェーズ1のLoRAがフェーズ2に意図せず影響を与えることはありません

強化されたモニタリング

以前： デバッグ用に1つのShowTextノードのみ
現在： 8つのShowTextノードで包括的な可視化：

生成設定メタデータ
フェーズ1およびフェーズ2の最終プロンプト
フェーズ1およびフェーズ2のトリガー単語
プロンプト解像度の検証
設定要約

柔軟なプロンプト管理

以前： 基本的なプロンプト継承
現在： 3つの明確なフェーズ2モードで以下を可能に：

標準的なリファイナーワークフロー（ベースプロンプトを継承）
完全なスタイル変更（ユニークなフェーズ2プロンプト）
詳細強化（ベースプロンプトに追加テキストを付加）

独立したランダマイズ

以前： 単一のワイルドカードプロンプトシステム
現在： フェーズごとに分離されたWildcardPromptFromStringノードで、バッチ生成時の多様性を最大化

📊 技術的変更

ノード数の進化

合計ノード数： 83 → 92（+9ノード）
ShowTextモニタリング： 1 → 8（+7ノード）
TriggerWord Toggle： 1 → 3（+2ノード）
CLIPTextEncode： 1 → 2（+1ノード — 適切なデュアルフェーズ分離）
WildcardPromptFromString： 1 → 2（+1ノード — フェーズごとのランダマイズ）
Power Promptノード： 2 → 3（+1ノード）
ReroutePrimitive： 25 → 23（-2ノード — ルーティングの簡略化）

削除されたノード

PrimitiveString — 機能がSDXLImageSettingsControllerに吸収
easy seed — 機能がSDXLImageSettingsControllerに吸収
EmptyLatentImagePresets — 機能がSDXLImageSettingsControllerに吸収

新アーキテクチャ

デュアルCLIPTextEncodeノード（フェーズごとに1つ）
フェーズごとのトリガー単語ルーティング
強化されたプロンプト処理パイプライン
集中型設定配布

🎨 新機能

ハイブリッドワークフローモード

最大詳細モード（最高品質出力）
- すべてのフェーズとすべての機能を有効にして実行：
  - フェーズ1：ベース生成 + FaceDetailer + 保存
  - Image Bridge + モデルアンロード
  - フェーズ2：微調整 + FaceDetailer + アップスケール + 保存
- 結果として6枚の保存画像が生成され、最終画像が最も微調整されたものになります
- フェーズ1とフェーズ2で同じモデルを使用するか、ハイブリッド効果のために異なるモデルを使用可能
- フェーズ1とフェーズ2で同じLoRAを使用するか、フェーズごとに異なるLoRAを使用可能
- TriggerWord Toggleノードでフェーズごとに使用するトリガー単語を選択可能
- フェーズ2モード：「Use Base (Phase 1)」
- フェーズ2 denoise：0.25-0.35（最小限の変更、最大限の微調整）
- denoise値が低いほどフェーズ1に忠実になり、詳細抽出が強化されます
- これがワークフローの究極の品質モードです
スタイル変換モード
- フェーズごとに異なるモデルを使用して劇的なスタイル変化を実現
- フェーズごとに異なるLoRAを使用（トリガーコンタミネーションなし！）
- フェーズごとに独立してトリガー単語を選択可能 — 各段階で必要な効果のみを有効化
- フェーズ2モード：「Unique Prompt」または「Append to Base」
- フェーズ2 denoise：0.35-0.6（中程度〜大幅な変化）
- denoise値が高いほどフェーズ1画像の変換が大きくなります
- 写実的 → アーティスティックスタイルへの変換に最適
- またはベース生成 → 専用強化（例：詳細モデル）に最適
クイックプレビューモード
- フェーズ2を完全に無効化（バイパスグループ）
- フェーズ1の生成のみ実行
- プロンプトテスト用の高速反復
- ベース結果に満足したらフルパイプラインを有効化
バッチ生成モード
- シードランダマイズが組み込まれ
- デュアルワイルドカード対応（フェーズごとに異なるプロンプト可能）
- フェーズごとのLoRAランダマイズ
- フェーズごとのトリガー単語選択 — バッチごとに適用するLoRA効果を微調整
- バッチ追跡用に8つのモニタリングポイント
- 最大品質を実現するためにすべての機能を有効化
- メモリ管理により50〜200枚以上の画像をクラッシュせずに処理可能

フェーズごとのトリガー単語制御（V1.2の主要機能）

V1.2で最も強力な新機能の1つは、フェーズごとに独立したトリガー単語選択です：

3つのTriggerWord Toggleノード（フェーズ1：2つ、フェーズ2：1つ）
各フェーズのLoRAマネージャーに複数のLoRAを読み込み
チェックボックスでフェーズごとに特定のトリガー単語を有効/無効に選択可能
例：フェーズ1では「高精細」トリガーを有効、フェーズ2では無効
例：フェーズ1ではキャラクターロラトリガーを使用、フェーズ2では品質トリガーのみ使用
クロスコンタミネーションなし — フェーズ1のトリガーは、あなたが望まない限りフェーズ2に影響を与えません
各段階で適用するLoRA効果を精密に調整可能
シングルフェーズワークフローでは不可能な複雑なLoRAスタック戦略を可能に

これにより、LoRA効果を手術のように精密に制御できます — 5つのLoRAを読み込んでも、フェーズ1ではそのうち2つのみのトリガーを使用し、フェーズ2では異なる組み合わせを使用できます。

フェーズ2 denoise設定ガイド

フェーズ2のdenoise値は、フェーズ2の微調整がフェーズ1の画像をどれだけ変更するかを制御します：

0.25-0.35（最小限の変更 — 最大限の微調整）
- フェーズ1の構成に非常に忠実
- 細部の詳細、テクスチャ、シャープネスを追加
- 最適用途：最大詳細抽出、同じモデルでのワークフロー
- 使用例：「変更せずに、より詳細にする」
0.35-0.5（中程度の微調整）
- 保持と強化のバランス
- 構造を維持しながら要素を追加・改善可能
- 最適用途：モデル混合、品質向上
- 使用例：「品質を向上させ、小さな問題を修正」
0.5-0.6（大幅な変化）
- 構成とスタイルに大きな変更
- フェーズ1はあくまで大まかなガイド
- 最適用途：スタイル転送、創造的再解釈
- 使用例：「これを別のものに変換」
0.6以上（実験的領域）
- フェーズ1画像からの大幅な逸脱
- フェーズ1はあくまで参考に
- 最適用途：極端なスタイル変化、創造的実験
- 使用例：「フェーズ1を単なる出発点として使用」

ヒント： プロフェッショナルなワークフローでは、フェーズ1の生成を維持しつつ微調整と詳細を追加するため、低いdenoise値（0.25-0.35）が最も一般的です。

🚀 ワークフロー改善

品質向上

ワンストップ設定 — すべての設定がSDXLImageSettingsControllerに集中
視覚的検証 — 8つのShowTextノードで何が起きているか明確に表示
探偵作業不要 — 設定要約出力
高速反復 — ワークフロー内を検索せずにKSampler設定を変更可能

プロフェッショナル機能

完全な再現性 — すべての設定が集中し、文書化
バッチ生成対応 — 50〜200枚以上のバッチ用に設計
柔軟な実験 — 3つのフェーズ2モードですべての使用ケースをカバー
LoRAの精密制御 — フェーズごとのトリガー制御で事故を防止

生産スケール

同じメモリ管理（200〜400枚以上の画像をクラッシュせずに処理）
同じ自動メタデータ埋め込み（A1111互換）
同じLoRAマネージャー視覚選択
同じFaceDetailerおよびアップスケール品質
より良い整理 — 集中型制御によりバッチ作業が容易に

⚡ ブレイキングチェンジ & 移行

必須カスタムノード

重要： V1.2は機能するために2つの新しいカスタムノードを必要とします：

sdxl_image_settings_controller.py
- ComfyUI/custom_nodes/ にダウンロードして配置
- 「SDXL」カテゴリにノードが表示されます
multi_phase_prompt_manager_2phase.py
- ComfyUI/custom_nodes/ にダウンロードして配置
- 「conditioning/prompt」カテゴリにノードが表示されます

両方のファイルはワークフローのダウンロードに同梱されています。

移行手順

ComfyUIのcustom_nodesフォルダに両方のカスタムノードをインストール
ComfyUIを完全に再起動
V1.2ワークフローを読み込む
SDXLImageSettingsControllerを設定（旧設定ノードを置き換え）
MultiPhasePromptManagerでフェーズ2モードを設定（通常は「Use Base (Phase 1)」）
LoRAトリガーを適切なTriggerWord Toggleノードに接続

互換性

元のワークフローと同じモデル（SDXL、Pony、Illustrious、NoobAI）で動作
同じLoRAマネージャー統合
同じメモリ管理システム
同じFaceDetailerおよびアップスケール設定
既存のすべてのLoRAとモデルは変更なしで使用可能

📖 ドキュメント更新

新規追加セクション

クイックスタートガイド（6ステップのワークフロー手順）
SDXLImageSettingsControllerリファレンス
MultiPhasePromptManager2Phase使用ガイド
フェーズごとのトリガー単語管理
一般的な設定例
強化されたトラブルシューティング

更新セクション

ワークフローコンポーネント（新規ノードのドキュメント化）
データフローアーキテクチャ（デュアルフェーズ管理向けに改訂）
ベストプラクティス（新機能の活用）
使用ケース（新ハイブリッドモード）

🎯 V1.2にアップグレードする理由

経験豊富なユーザー向け

効率向上 — 集中制御で時間節約
プロフェッショナルワークフロー — より良い組織とモニタリング
高度な制御 — フェーズごとのLoRA分離で新しい可能性を開放
バッチ生成 — 大規模実行向けに強化されたモニタリングと制御

初心者向け

学習しやすい — 1つのノードでほとんどの設定を制御
明確な構造 — ShowTextノードで何が起きているか可視化
充実したドキュメント — クイックスタートガイドと例
混乱の削減 — 集中設定でエラーを低減

すべてのユーザー向け

同じ品質 - すべての元の機能を維持
より整理されている - クリーンなワークフロー構造
より柔軟 - 3つのフェーズ2モードですべてのシナリオをカバー
将来に備えた - アーキテクチャが今後の拡張をサポート

🐛 既知の問題

現在、問題はありません。これは広範なテストを経た安定版です。

問題が発生した場合：

カスタムノードが正しくインストールされていることを確認してください
カスタムノードをインストール後、ComfyUIを再起動してください
ShowTextノードを確認して、プロンプトとトリガーワードの流れを検証してください
MultiPhasePromptManagerでフェーズ2モードが適切に設定されていることを確認してください

📝 バージョン履歴

V1.2（現在版）

SDXLImageSettingsControllerを追加（設定の集中管理）
MultiPhasePromptManager2Phaseを追加（高度なプロンプト継承）
モニタリングインフラの拡張（1 → 8つのShowTextノード）
フェーズごとのLoRAトリガー制御（3つのTriggerWord Toggleノード）
ダブルCLIPTextEncodeアーキテクチャ
ドキュメントとクイックスタートガイドの強化

V1.1（前版）

プロダクション用デュアルフェーズリファイナー
LoRA Managerとの統合
自動A1111メタデータ埋め込み
バッチ処理のためのメモリ最適化
ダブルFaceDetailerパス
ESRGAN 4xアップスケーリング

🙏 クレジット

ワークフロー設計： DarthRidonkulous
カスタムノード： Claude（Anthropic）と共同開発
テストプラットフォーム： SDXL、Pony、Illustrious、NoobAIモデルファミリー
本番テスト： 200〜400枚の画像バッチ、98%の成功率

📥 ダウンロード内容

ComfyUI_2Phase_Super_Refiner_V1_2.json（ワークフローファイル）
sdxl_image_settings_controller.py（カスタムノード）
multi_phase_prompt_manager_2phase.py（カスタムノード）
クイックスタートガイド（ワークフローのノートノードに埋め込み）
完全なドキュメント（この投稿）

🔗 サポートとコミュニティ

問題がありますか？ 完全なドキュメントのトラブルシューティングセクションをご確認ください。
質問がありますか？ この投稿にコメントするか、以前のコメントをご確認ください。
気に入りましたか？ レビューを残し、あなたの結果を共有してください！

このワークフローは、数百時間にわたる開発、テスト、洗練の成果です。価値があると感じた場合は、あなたの創作を共有し、他のユーザーを支援することでサポートしてください。

V1.2をお楽しみください！これまでで最も強力で使いやすいバージョンです。 🚀

モデル説明

生産用デュアルフェーズリファイナー - LoRAマネージャー + 自動メタデータ + メモリ最適化ワークフロー

概要

生産用デュアルフェーズリファイナーは、高度な2段階の精緻化プロセスと統合されたLoRAマネージャー対応、自動メタデータ埋め込み機能を備えた、プロフェッショナル向けComfyUIワークフローです。このワークフローにより、画像生成パイプラインを完全に制御しながら、大規模バッチ処理にも対応する効率的なメモリ管理で、高品質で詳細な画像を生成できます。視覚的なLoRA選択、A1111互換メタデータの自動埋め込み、戦略的なメモリ最適化により、ワークフローのスムーズな運用、完全な再現性、大規模なバッチ処理におけるクラッシュフリー実行を実現します。

モデル互換性

スキルレベル： このワークフローは、ComfyUIのノードベースインターフェースに慣れており、サンプラー、スケジューラ、ノイズ除去強度、モデル読み込みなどの概念を理解しているユーザー向けのアドバンスドワークフローです。ComfyUIに初めて触れる場合は、この生産用システムの前に、よりシンプルなシングルフェーズワークフローから始めるのがおすすめです。

最適化対象： このワークフローは、SDXL、Pony、Illustrious、NoobAIのベースモデルで広くテストされ、最高のパフォーマンスを発揮します。現在の設定とモデル構成では、これらのモデルファミリーで98%の成功率を達成しています。

重要 - ベースモデルの変更： このワークフローはデフォルトのベースモデルに最適化されたKSampler設定で事前構成されています。別のベースモデルに切り替える場合（特にSDXL→PonyやPony→Illustriousなどのモデルファミリー間）、Phase 1およびPhase 2の両方でKSamplerパラメータ（ステップ数、CFGスケール、サンプラー種類、スケジューラ）をそのモデルの最適設定に合わせて調整する必要があります。各モデルには独自の最適パラメータ（スイートスポット）があり、あるチェックポイントで完璧に動作する設定が、別のチェックポイントでは劣化した結果を生むことがあります。

SD 1.5モデル： このワークフローはSD 1.5ベースモデルではテストされていませんが、SDXLベースのチェックポイントと組み合わせて使用する場合、一部のSD 1.5 LoRAは動作する可能性があります。

Fluxモデル： このワークフローはFluxベースのモデルには対応していません。Flux向けの専用ワークフローは現在開発中です。

推奨： 最良の結果を得るには、このワークフローでSDXLファミリーのチェックポイント（Pony、Illustrious、NoobAIを含む）を使用してください。異なるベースモデルを試す際には、KSampler設定の調整を想定してください。

主な機能

自動メタデータ埋め込みシステム

このワークフローの最も強力なプロフェッショナル機能の一つは、完全な自動メタデータのキャプチャと埋め込みです：

A1111互換形式 - 生成されるすべての画像に、Auto1111互換形式で完全なメタデータが埋め込まれます。これにより、CivitAIや他のプラットフォームとのシームレスな互換性が保証されます。手動でのデータ入力は一切不要です。

完全なプロヴェナンス追跡 - Debug Metadata（LoraManager）ノードは自動的に以下の情報をキャプチャします：

すべての生成パラメータ（ステップ数、CFG、サンプラー、スケジューラ）
重み付きの完全なLoRA情報
モデル/チェックポイントの詳細
プロンプトとネガティブプロンプト
完全な再現性のためのシード値
画像の寸法と技術的設定

プロフェッショナルワークフローの利点：

ドキュメント作成の負荷ゼロ - 成功した生成はすべて自己文書化されます
完全な再現性 - どの画像がどの設定で生成されたかを常に正確に把握できます
CivitAI最適化 - 正しいメタデータにより、検索性とインデックス化が向上します
クライアント/コラボレーション対応 - 手動で転記する必要なく、正確な設定を共有できます
ポートフォリオ品質 - 完全なプロヴェナンスにより、技術的なプロフェッショナリズムを示せます

ビジネスインテリジェンス - 200〜400枚の画像をバッチ処理する際、自動メタデータにより、最良の結果を生み出した設定を、推測や調査なしに正確に特定できます。

統合LoRAマネージャーシステム

完全なLoRAマネージャー統合により、LoRAとの作業方法が変わります：

視覚的LoRA選択 - 無数の難解なファイル名をスクロールする代わりに、LoRAマネージャーは各LoRAの効果をサムネイルプレビューで表示します。この視覚的アプローチは、特に画像をテキストよりよく覚える傾向がある（AuDHD/ADHDユーザーに多い）ユーザーにとって、圧倒的に速く直感的です。

シームレスなメタデータ統合 - LoRAマネージャーは自動メタデータシステムと連携し、選択したすべてのLoRAが、正しい重みと識別子で最終画像に適切に記録されます。

フェーズごとのLoRA管理 - 各フェーズで独立したLoRAマネージャー対応を備え、精緻化ステージごとに異なるLoRAセットを視覚的に選択・設定できます。

高度なメモリ管理

このワークフローの重要な生産機能の一つは、クラッシュなしに大規模バッチ処理を処理するためのインテリジェントなリソース管理システムです：

モデルアンローダー - これらの専用ノードは、不要になったAIモデルをGPUのメモリ（VRAM）から自動的に削除します。パフォーマンスの各幕の間にステージを片付ける清掃チームのようなものです。

RAMクリーナー - これらのノードは、長時間のバッチ処理中にシステムを遅くしたりクラッシュさせたりする一時データの蓄積を防ぐため、コンピュータのメインメモリをクリアします。

戦略的配置 - メモリ管理ノードはワークフローの重要な移行ポイントに配置され、生成プロセス全体で最適なパフォーマンスを確保します。

生産規模対応 - VRAM枯渇やシステムクラッシュなしに、単一バッチで200〜400枚以上の画像を処理できます。夜間の生成も安心して実行できます。

デュアルフェーズアーキテクチャ

このワークフローは画像生成を2つの明確なフェーズに分離し、それぞれ独立または順次実行可能です：

モデル選択の柔軟性：

両フェーズで同じベースモデルを使用し、単一モデルの限界まで超精緻化・高詳細化を実現
各フェーズで異なるベースモデルを使用し、複数のチェックポイントの長所を組み合わせ、ユニークなハイブリッド効果や専門的な精緻化を達成
必要に応じて各フェーズを完全に無効化可能で、最大限のワークフロー柔軟性を提供

LoRAの独立性：

両フェーズで同じLoRAを適用し、特定の効果やディテールを強化
各フェーズで完全に異なるLoRAセットを使用し、複数の芸術的スタイルや技術的強化を重ねる
フェーズ間でLoRAを戦略的にミックス＆マッチし、創造的な実験を可能に

フェーズ制御システム

ワークフローの各主要セクションは独立して有効/無効にできます：

Phase 1 - 初期画像生成
Phase 2 - オプションでモデル切り替え可能な二次精緻化
FaceDetailerグループ - 特化した顔強化パス
アップスケーリングセクション - 解像度強化ステージ

このモジュール設計により、クイックプレビュー（Phase 1のみ）から最高品質レンダリング（全フェーズ有効）まで、プロジェクトに応じてワークフローをカスタマイズできます。

ワークフローコンポーネント

モデル読み込みノード

CheckpointLoader - 画像を生成するメインAIモデル（チェックポイント）を読み込む起点です。アートの作り方を理解する「脳」を読み込むようなものです。

LoraLoader - ベースモデルの挙動を変更する追加の専用学習ファイル（LoRA）を読み込むノードです。LoRAはAIに特定のスキルや芸術スタイルを付与するようなものです。複数のLoRAローダーを積み重ねて効果を組み合わせられます。LoRAマネージャーと統合すると、視覚的プレビュー機能付きで選択が簡単になります。

LoRAマネージャー統合 - LoRAの効果を視覚的サムネイルで表示し、選択を直感的かつ迅速にします。「detail_enhancer_v2_final_ACTUALLY_FINAL.safetensors」のような難解なファイル名を覚える代わりに、目指す視覚スタイルを認識するだけです。これは視覚記憶に優れた神経多様性ユーザーにとって特に価値があります。

VAELoader - VAE（変分オートエンコーダ）を読み込み、AIの内部表現と実際に見えるピクセルの間を変換します。高品質なVAEは、最終画像の色合いとシャープネスを保証します。

生成制御ノード

KSampler - 画像生成プロセスの中心です。このノードは、AIがテキスト説明をもとにランダムノイズを段階的に一貫した画像へと変換する「夢見る」プロセスを制御します。

重要な注意点： このワークフローにはPhase 1とPhase 2の両方にKSamplerノードが含まれており、特定のベースモデルに最適化された設定で事前構成されています。異なるベースモデルに切り替える場合（特にモデルファミリー間）、ステップ数、CFGスケール、サンプラー種類（dpm_2、euler_a、dpmpp_3m_sdeなど）、スケジューラ（karras、simple、normalなど）を、選択したモデルの要件に合わせて調整する必要があります。各モデルファミリーには独自の最適パラメータがあります。

EmptyLatentImage - 画像が生成される初期の空白キャンバスを作成します。ここで設定したサイズがベース画像の寸法になります。

CLIPTextEncode - テキストプロンプトをAIが理解できる数学的言語に変換します。ポジティブプロンプト（欲しいもの）とネガティブプロンプト（避けるもの）のための別々のノードがあります。

シードノード（easy seed） - 生成される各画像のユニーク性を決定するランダム数値生成器を制御します。同じシードと設定で再生成すると、同じ結果が得られます（再現性に最適）。シードをランダム化するとバリエーションが生まれます。大規模バッチ処理で多様な出力を得たり、他の変数を固定したままパラメータ変更のA/Bテストを行う際に不可欠です。

ワイルドカードノード - 事前に定義されたオプションリストからランダムに選択することで、プロンプトの動的バリエーションを可能にします。生成ごとに手動でプロンプトを変更する代わりに、ワイルドカードでポーズ、照明、スタイルなどのカテゴリを定義し、ワークフローが各画像に対して自動的にランダム選択します。これにより、手動介入なしに大規模バッチで多様なコンテンツを生成でき、コア要素を維持しながら数百枚の画像にわたる多様性を保つのに最適です。

精緻化ノード

FaceDetailer - 画像内の顔を検出し、詳細を強化して再生成する専用ツールです。このワークフローでは、最大の顔品質を得るために各フェーズで1回ずつ（有効時）FaceDetailerを使用します。各パスで異なる検出設定とモデルを使用できます。

設定済みパラメータ： ワークフローは、0.35のノイズ除去強度、20ステップ、DPM_2サンプラーとKarrasスケジューラ、0.93の検出しきい値など、厳密に調整されたFaceDetailerパラメータを使用しています。これらの設定は、テストしたSDXLファミリーの98%のベースモデルで非常に信頼性が高いことが証明されています。

ImageUpscaleWithModel - AIアップスケーリングモデルを使用して画像の解像度を向上させます。単純な拡大とは異なり、これらのモデルは画像を拡大する際に知的なディテールを追加します。

設定済みモデル： このワークフローはESRGAN_4x.pthをアップスケーリングに使用しており、画像の整合性を保ちながら優れたディテール強化を実現します。このアップスケーラーは、SDXL、Pony、Illustrious、NoobAIのすべてのモデルファミリーで一貫して優れた性能を発揮します。

検出とセグメンテーションノード

UltralyticsDetectorProvider - 画像内の特定のオブジェクト（顔、手、体など）を識別するAIモデルを提供します。これによりFaceDetailerが顔の位置を正確に把握できます。

設定済みモデル： セグメンテーション検出に**segm/skin_yolov8n-seg_800.pt**を使用します。このモデルは肌領域と顔の境界を非常に優れた精度で識別し、FaceDetailerの正確な動作に不可欠です。

SAMLoader - Segment Anything Model（SAM）を読み込み、画像内のオブジェクトを正確にアウトライン化します。詳細な精緻化のために領域を分離するのに役立ちます。

設定済みモデル： sam_vit_b_01ec64.pthをAUTOモードで使用します。このバランスの取れたSAMモデルは、過剰なVRAM使用を抑えつつ優れたセグメンテーション精度を提供し、バッチ処理ワークフローに最適です。

SegmDetectorSEGS - セグメンテーションモデルを使用して画像の異なる領域を識別・分離し、ターゲット強化に使用します。SAMとUltralyticsモデルと連携して、精緻化のための正確なマスクを作成します。

画像処理ノード

VAEDecode - AIの内部画像表現を、表示・保存可能な通常のピクセルに変換します。

VAEEncode - その逆で、通常の画像をAIの内部形式に変換してさらに処理します。

ImageScale - 画像を特定の寸法にリサイズします。ワークフローフェーズ間の画像準備に役立ちます。

出力と整理ノード

SaveImage - 生成された画像をディスクに保存します。このワークフローには複数の保存ポイントがあり、異なる品質段階で結果をキャプチャできます。

サブディレクトリノード（PrimitiveString） - 保存された画像をカスタムサブディレクトリ/フォルダに整理できます。すべての画像が1つのフォルダにdumpされるのではなく、フェーズや画像タイプごとに別々のサブフォルダ（例：「Phase1_Base」、「Phase2_Refined」、「Final_Upscaled」）にルーティングできます。大規模バッチ出力を管理し、生産を整理する上で不可欠です。特に複数のプロジェクトで数百枚の画像を処理する場合に非常に価値があります。

デバッグメタデータ（LoRA Manager） - A1111互換形式で、画像内に生成設定、使用したLoRA、その他のメタデータをすべてキャプチャして保存します。これは以下の点で不可欠です：

特定の結果を生み出した設定を追跡する
CivitAIのような画像共有プラットフォームとの互換性を確保する
最高の生成結果を完全に再現可能に保つ
手動でのデータ入力なしにLoRA情報を自動的に埋め込む
プロフェッショナルなワークフローのドキュメンテーション

このノードは、LoRA Managerの視覚的選択システムと最終画像のメタデータとのシームレスな統合を可能にし、成功した設定を決して見失わないようにします。

ルーティングおよび組織化ノード

ReroutePrimitive - ジャンクションボックスのように機能し、ワイヤーが複雑に交差することなく、1つのノードから複数の宛先にデータを送信できます。これによりワークフローが整理され、読みやすくなります。

バイパススイッチ - 何の接続も切り離すことなく、ワークフローの特定のセクションをオン/オフ切り替えられる特別なノードです。

メモリ管理ノード

SoftModelUnloader - 使用済みのAIモデルをVRAMから賢く削除し、次の処理フェーズのためにGPUメモリを解放します。

easy clearCacheAll - VRAMとシステムRAMの両方のキャッシュを包括的にクリアし、バッチ処理中のメモリ蓄積を防ぎます。

ワークフローステージ

フェーズ1：ベース画像生成

ワークフローは、選択したチェックポイントモデルとLoRAを使用して初期画像を生成することから始まります。このフェーズには以下が含まれます：

テキストプロンプトの処理
指定した解像度での初期画像生成
最初のFaceDetailer処理（オプション）
初期画像の保存ポイント

トランジションブリッジ

フェーズ間では、ワークフローに以下が含まれます：

VRAMを解放するためのモデルアンロードノード
必要に応じた画像形式変換
オプションのチェックポイントスワップ準備

フェーズ2：スーパー精緻化

第2フェーズでは、ベース画像をさらに高品質に仕上げます：

フェーズ2モデルの読み込み（同じまたは異なるモデル可）
フェーズ2 LoRAの読み込み（同じまたは異なるLoRA可）
高詳細度での画像から画像への精緻化
2回目のFaceDetailer処理（オプション）
最終アップスケーリング処理
最終画像の保存

クリーンアップステージ

すべての生成が完了した後：

包括的なメモリクリーンアップ
最終モデルのアンロード
次のバッチ処理の準備のためのキャッシュクリア

使用例

ビジュアルLoRA実験モード

LoRA Managerのビジュアルプレビューを活用して、さまざまなLoRAの組み合わせを迅速にテストできます。視覚的に考える人やAuDHD/ADHDのユーザーに最適で、ファイル名を解釈する必要なく効果を即座に認識できます。自動メタデータキャプチャにより、すべての成功した実験が将来の使用に完全に文書化されます。

最大詳細モード

両方のフェーズで同じモデルとLoRAを有効にします。単一のチェックポイントから可能な限りすべての詳細を引き出すのに最適です。

ハイブリッド強化モード

各フェーズで異なるモデルを使用します。たとえば、ベース画像は汎用モデルで生成し、精緻化には写実性専用モデルを使用します。

スタイルブレンディングモード

フェーズ1で芸術的スタイルLoRAを適用し、フェーズ2で技術的強化LoRAに切り替えて、スタイル豊かで技術的に完璧な結果を得ます。

バッチ生産モード

フェーズを戦略的に無効化することで、大量の画像を生成する際の品質対速度の最適なバランスを見つけられます。

メモリ効率

このワークフローに配置されたメモリ管理ノードにより、以下が可能になります：

VRAMが不足することなく、大規模なバッチ（50〜200枚以上）を処理
RAMの枯渇によるシステムクラッシュを防止
長時間の生成セッションでも一貫したパフォーマンスを維持
中価格帯のハードウェアで高解像度ワークフローを実行

ワークフローは、各主要な遷移ポイントでメモリをクリアすることで、各フェーズを最大リソースで開始できるようにします。

技術的利点

自動メタデータシステム - A1111互換の完全なメタデータ埋め込みにより、手動ドキュメンテーションの負荷が削減されます。すべての画像が完全なプロヴェナンス追跡を備えた自己記述型となり、完璧な再現性とCivitAIとのプロフェッショナルな互換性を実現します。成功した設定を失うことはなく、手動でのパラメータ転記に時間を無駄にすることはありません。

ビジュアルLoRA管理 - 統合されたLoRA Managerサポートにより、ファイル名ベースのLoRA選択による認知的負荷が解消されます。ビジュアルプレビューにより実験が速く直感的になり、特にテキスト記憶より視覚記憶に優れる神経多様性のあるユーザーにとって非常に価値があります。メタデータシステムとのシームレスな統合により、すべてのLoRAが適切に文書化されます。

プロダクションレベルのメモリ最適化 - 戦略的に配置されたモデルアンローダーとRAMクリーナーにより、クラッシュなしで200〜400枚以上の画像をバッチ処理できます。夜間生成を安心して実行でき、バッチ処理中にVRAMやシステムメモリが枯渇することはありません。

モジュール性 - すべての主要なセクションは、ワークフローロジックを破壊することなく個別に有効/無効化できます。

スケーラビリティ - 1枚の画像を生成する場合でも、数百枚のバッチを処理する場合でも、メモリ管理により一貫したパフォーマンスを実現します。

柔軟性 - モデル、LoRA、設定をフェーズ間で切り替えても、ワークフロー全体を再構築する必要はありません。

品質管理 - 複数の保存ポイントにより、異なる精緻化段階の結果を比較し、最適な設定を調整できます。

メタデータ保持 - 保存された画像に完全な生成情報が埋め込まれ、再現性とプラットフォーム互換性が確保されます。

最良の実践

ベースモデルを理解する - 開始前に、選択したベースモデルの最適なKSampler設定を把握してください。モデルのドキュメントやコミュニティ推奨値を確認し、ステップ、CFG、サンプラー、スケジューラの値を確認してください。ワークフローのデフォルト設定はすべてのモデルに最適とは限りません。
ビジュアルLoRA選択を活用する - ファイル名を暗記するのではなく、LoRA Managerのサムネイルプレビューで効果を素早く特定してください。これにより実験が劇的に高速化し、認知的負荷が軽減されます。
シンプルに始める - 完全な精緻化を有効にする前に、フェーズ1のみでプロンプトと設定をテストしてください。これにより、二重フェーズ処理に時間を投資する前にベース生成の品質を確認できます。
メモリを監視する - VRAM使用量を確認し、ハードウェアに応じてオプションのステージを無効化する必要があるかどうかを判断してください。
モデルを試す - 最初は同じチェックポイントを両方のフェーズで試し、その後異なる組み合わせを試して独自の効果を発見してください。モデルを切り替えるときはKSampler設定を調整することを忘れないでください。
LoRAを戦略的にレイヤー化する - フェーズ1では汎用的なLoRA、フェーズ2では詳細強化用の専門LoRAを使用してください。ビジュアルプレビューシステムにより、効果的な組み合わせを簡単に構築できます。
メタデータシステムを信頼する - 自動メタデータ埋め込みにより、成功した設定を手動で文書化する必要はありません。すべての画像が自己記述型です。
バッチ処理 - メモリ管理システムはバッチ操作中に最大の効果を発揮します。夜間実行により生産性を最大化してください。

結論

Production Dual-Phase Refinerは、視覚的LoRA管理、自動メタデータ埋め込み、プロダクション規模のメモリ最適化という3つのコア原則に基づいたプロフェッショナルなAI画像生成アプローチです。単一の傑作画像の作成から、大量のバッチ処理まで、このワークフローはプロフェッショナルな信頼性で卓越した結果を提供します。

LoRA Manager統合は、LoRA選択をテキストベースのファイル名検索から、高速で視覚的認識へと変革します。特に視覚記憶に優れる神経多様性のあるユーザーにとって非常に価値があります。自動A1111互換メタデータ埋め込みは、すべての画像を完全なプロヴェナンス追跡を備えた自己記述型にし、手動ドキュメンテーションの負荷を排除し、完璧な再現性を実現します。戦略的なメモリ管理は、200〜400枚以上の画像を一晩でクラッシュなしにバッチ処理できる能力を実証しています。

柔軟な二重フェーズアーキテクチャ（フェーズ間で同じまたは異なるモデル/LoRAをサポート）と完全なモジュラー制御を組み合わせることで、このワークフローはあらゆるクリエイティブまたは生産シナリオに対応します。アマチュアの実験から、CivitAIのようなプロフェッショナルなコンテンツ作成まで、Production Dual-Phase Refinerは、あなたの野心に応じてスケールする品質、信頼性、直感的なユーザーエクスペリエンスを提供します。

実戦検証済み設定：このワークフローは、ESRGAN_4xアップスケーリング、最適化されたFaceDetailerパラメータ、バランスの取れたSAM/YOLO検出モデルなど、SDXL、Pony、Illustrious、NoobAIモデルファミリー全体で98％の成功率を達成した丁寧に調整された設定で事前構成されています。これらは理論的な設定ではなく、膨大な実際のバッチ処理を通じて洗練された実用的な設定です。

このモデルで生成された画像

並び替え

画像が見つかりません。

モデルタイプ	ワークフロー
ベースモデル	SDXL 1.0
公開日	11/17/2025