Production Dual-Phase Refiner - LoRA Manager + Auto Metadata + Memory Optimized Workflow

詳細

ファイルをダウンロード

モデル説明

生産用デュアルフェーズリファイナー - LoRAマネージャー + 自動メタデータ + メモリ最適化ワークフロー

概要

生産用デュアルフェーズリファイナーは、高度な2段階の精緻化プロセスと統合されたLoRAマネージャー対応、自動メタデータ埋め込み機能を備えた、プロフェッショナル向けComfyUIワークフローです。このワークフローにより、画像生成パイプラインを完全に制御しながら、大規模バッチ処理にも対応する効率的なメモリ管理で、高品質で詳細な画像を生成できます。視覚的なLoRA選択、A1111互換メタデータの自動埋め込み、戦略的なメモリ最適化により、ワークフローのスムーズな運用、完全な再現性、大規模なバッチ処理におけるクラッシュフリー実行を実現します。

モデル互換性

スキルレベル: このワークフローは、ComfyUIのノードベースインターフェースに慣れており、サンプラー、スケジューラ、ノイズ除去強度、モデル読み込みなどの概念を理解しているユーザー向けのアドバンスドワークフローです。ComfyUIに初めて触れる場合は、この生産用システムの前に、よりシンプルなシングルフェーズワークフローから始めるのがおすすめです。

最適化対象: このワークフローは、SDXL、Pony、Illustrious、NoobAIのベースモデルで広くテストされ、最高のパフォーマンスを発揮します。現在の設定とモデル構成では、これらのモデルファミリーで98%の成功率を達成しています。

重要 - ベースモデルの変更: このワークフローはデフォルトのベースモデルに最適化されたKSampler設定で事前構成されています。別のベースモデルに切り替える場合(特にSDXL→PonyやPony→Illustriousなどのモデルファミリー間)、Phase 1およびPhase 2の両方でKSamplerパラメータ(ステップ数、CFGスケール、サンプラー種類、スケジューラ)をそのモデルの最適設定に合わせて調整する必要があります。各モデルには独自の最適パラメータ(スイートスポット)があり、あるチェックポイントで完璧に動作する設定が、別のチェックポイントでは劣化した結果を生むことがあります。

SD 1.5モデル: このワークフローはSD 1.5ベースモデルではテストされていませんが、SDXLベースのチェックポイントと組み合わせて使用する場合、一部のSD 1.5 LoRAは動作する可能性があります。

Fluxモデル: このワークフローはFluxベースのモデルには対応していません。Flux向けの専用ワークフローは現在開発中です。

推奨: 最良の結果を得るには、このワークフローでSDXLファミリーのチェックポイント(Pony、Illustrious、NoobAIを含む)を使用してください。異なるベースモデルを試す際には、KSampler設定の調整を想定してください。

主な機能

自動メタデータ埋め込みシステム

このワークフローの最も強力なプロフェッショナル機能の一つは、完全な自動メタデータのキャプチャと埋め込みです:

A1111互換形式 - 生成されるすべての画像に、Auto1111互換形式で完全なメタデータが埋め込まれます。これにより、CivitAIや他のプラットフォームとのシームレスな互換性が保証されます。手動でのデータ入力は一切不要です。

完全なプロヴェナンス追跡 - Debug Metadata(LoraManager)ノードは自動的に以下の情報をキャプチャします:

  • すべての生成パラメータ(ステップ数、CFG、サンプラー、スケジューラ)
  • 重み付きの完全なLoRA情報
  • モデル/チェックポイントの詳細
  • プロンプトとネガティブプロンプト
  • 完全な再現性のためのシード値
  • 画像の寸法と技術的設定

プロフェッショナルワークフローの利点:

  • ドキュメント作成の負荷ゼロ - 成功した生成はすべて自己文書化されます
  • 完全な再現性 - どの画像がどの設定で生成されたかを常に正確に把握できます
  • CivitAI最適化 - 正しいメタデータにより、検索性とインデックス化が向上します
  • クライアント/コラボレーション対応 - 手動で転記する必要なく、正確な設定を共有できます
  • ポートフォリオ品質 - 完全なプロヴェナンスにより、技術的なプロフェッショナリズムを示せます

ビジネスインテリジェンス - 200〜400枚の画像をバッチ処理する際、自動メタデータにより、最良の結果を生み出した設定を、推測や調査なしに正確に特定できます。

統合LoRAマネージャーシステム

完全なLoRAマネージャー統合により、LoRAとの作業方法が変わります:

視覚的LoRA選択 - 無数の難解なファイル名をスクロールする代わりに、LoRAマネージャーは各LoRAの効果をサムネイルプレビューで表示します。この視覚的アプローチは、特に画像をテキストよりよく覚える傾向がある(AuDHD/ADHDユーザーに多い)ユーザーにとって、圧倒的に速く直感的です。

シームレスなメタデータ統合 - LoRAマネージャーは自動メタデータシステムと連携し、選択したすべてのLoRAが、正しい重みと識別子で最終画像に適切に記録されます。

フェーズごとのLoRA管理 - 各フェーズで独立したLoRAマネージャー対応を備え、精緻化ステージごとに異なるLoRAセットを視覚的に選択・設定できます。

高度なメモリ管理

このワークフローの重要な生産機能の一つは、クラッシュなしに大規模バッチ処理を処理するためのインテリジェントなリソース管理システムです:

モデルアンローダー - これらの専用ノードは、不要になったAIモデルをGPUのメモリ(VRAM)から自動的に削除します。パフォーマンスの各幕の間にステージを片付ける清掃チームのようなものです。

RAMクリーナー - これらのノードは、長時間のバッチ処理中にシステムを遅くしたりクラッシュさせたりする一時データの蓄積を防ぐため、コンピュータのメインメモリをクリアします。

戦略的配置 - メモリ管理ノードはワークフローの重要な移行ポイントに配置され、生成プロセス全体で最適なパフォーマンスを確保します。

生産規模対応 - VRAM枯渇やシステムクラッシュなしに、単一バッチで200〜400枚以上の画像を処理できます。夜間の生成も安心して実行できます。

デュアルフェーズアーキテクチャ

このワークフローは画像生成を2つの明確なフェーズに分離し、それぞれ独立または順次実行可能です:

モデル選択の柔軟性:

  • 両フェーズで同じベースモデルを使用し、単一モデルの限界まで超精緻化・高詳細化を実現
  • 各フェーズで異なるベースモデルを使用し、複数のチェックポイントの長所を組み合わせ、ユニークなハイブリッド効果や専門的な精緻化を達成
  • 必要に応じて各フェーズを完全に無効化可能で、最大限のワークフロー柔軟性を提供

LoRAの独立性:

  • 両フェーズで同じLoRAを適用し、特定の効果やディテールを強化
  • 各フェーズで完全に異なるLoRAセットを使用し、複数の芸術的スタイルや技術的強化を重ねる
  • フェーズ間でLoRAを戦略的にミックス&マッチし、創造的な実験を可能に

フェーズ制御システム

ワークフローの各主要セクションは独立して有効/無効にできます:

  • Phase 1 - 初期画像生成
  • Phase 2 - オプションでモデル切り替え可能な二次精緻化
  • FaceDetailerグループ - 特化した顔強化パス
  • アップスケーリングセクション - 解像度強化ステージ

このモジュール設計により、クイックプレビュー(Phase 1のみ)から最高品質レンダリング(全フェーズ有効)まで、プロジェクトに応じてワークフローをカスタマイズできます。

ワークフローコンポーネント

モデル読み込みノード

CheckpointLoader - 画像を生成するメインAIモデル(チェックポイント)を読み込む起点です。アートの作り方を理解する「脳」を読み込むようなものです。

LoraLoader - ベースモデルの挙動を変更する追加の専用学習ファイル(LoRA)を読み込むノードです。LoRAはAIに特定のスキルや芸術スタイルを付与するようなものです。複数のLoRAローダーを積み重ねて効果を組み合わせられます。LoRAマネージャーと統合すると、視覚的プレビュー機能付きで選択が簡単になります。

LoRAマネージャー統合 - LoRAの効果を視覚的サムネイルで表示し、選択を直感的かつ迅速にします。「detail_enhancer_v2_final_ACTUALLY_FINAL.safetensors」のような難解なファイル名を覚える代わりに、目指す視覚スタイルを認識するだけです。これは視覚記憶に優れた神経多様性ユーザーにとって特に価値があります。

VAELoader - VAE(変分オートエンコーダ)を読み込み、AIの内部表現と実際に見えるピクセルの間を変換します。高品質なVAEは、最終画像の色合いとシャープネスを保証します。

生成制御ノード

KSampler - 画像生成プロセスの中心です。このノードは、AIがテキスト説明をもとにランダムノイズを段階的に一貫した画像へと変換する「夢見る」プロセスを制御します。

重要な注意点: このワークフローにはPhase 1とPhase 2の両方にKSamplerノードが含まれており、特定のベースモデルに最適化された設定で事前構成されています。異なるベースモデルに切り替える場合(特にモデルファミリー間)、ステップ数、CFGスケール、サンプラー種類(dpm_2、euler_a、dpmpp_3m_sdeなど)、スケジューラ(karras、simple、normalなど)を、選択したモデルの要件に合わせて調整する必要があります。各モデルファミリーには独自の最適パラメータがあります。

EmptyLatentImage - 画像が生成される初期の空白キャンバスを作成します。ここで設定したサイズがベース画像の寸法になります。

CLIPTextEncode - テキストプロンプトをAIが理解できる数学的言語に変換します。ポジティブプロンプト(欲しいもの)とネガティブプロンプト(避けるもの)のための別々のノードがあります。

シードノード(easy seed) - 生成される各画像のユニーク性を決定するランダム数値生成器を制御します。同じシードと設定で再生成すると、同じ結果が得られます(再現性に最適)。シードをランダム化するとバリエーションが生まれます。大規模バッチ処理で多様な出力を得たり、他の変数を固定したままパラメータ変更のA/Bテストを行う際に不可欠です。

ワイルドカードノード - 事前に定義されたオプションリストからランダムに選択することで、プロンプトの動的バリエーションを可能にします。生成ごとに手動でプロンプトを変更する代わりに、ワイルドカードでポーズ、照明、スタイルなどのカテゴリを定義し、ワークフローが各画像に対して自動的にランダム選択します。これにより、手動介入なしに大規模バッチで多様なコンテンツを生成でき、コア要素を維持しながら数百枚の画像にわたる多様性を保つのに最適です。

精緻化ノード

FaceDetailer - 画像内の顔を検出し、詳細を強化して再生成する専用ツールです。このワークフローでは、最大の顔品質を得るために各フェーズで1回ずつ(有効時)FaceDetailerを使用します。各パスで異なる検出設定とモデルを使用できます。

設定済みパラメータ: ワークフローは、0.35のノイズ除去強度、20ステップ、DPM_2サンプラーとKarrasスケジューラ、0.93の検出しきい値など、厳密に調整されたFaceDetailerパラメータを使用しています。これらの設定は、テストしたSDXLファミリーの98%のベースモデルで非常に信頼性が高いことが証明されています。

ImageUpscaleWithModel - AIアップスケーリングモデルを使用して画像の解像度を向上させます。単純な拡大とは異なり、これらのモデルは画像を拡大する際に知的なディテールを追加します。

設定済みモデル: このワークフローはESRGAN_4x.pthをアップスケーリングに使用しており、画像の整合性を保ちながら優れたディテール強化を実現します。このアップスケーラーは、SDXL、Pony、Illustrious、NoobAIのすべてのモデルファミリーで一貫して優れた性能を発揮します。

検出とセグメンテーションノード

UltralyticsDetectorProvider - 画像内の特定のオブジェクト(顔、手、体など)を識別するAIモデルを提供します。これによりFaceDetailerが顔の位置を正確に把握できます。

設定済みモデル: セグメンテーション検出に**segm/skin_yolov8n-seg_800.pt**を使用します。このモデルは肌領域と顔の境界を非常に優れた精度で識別し、FaceDetailerの正確な動作に不可欠です。

SAMLoader - Segment Anything Model(SAM)を読み込み、画像内のオブジェクトを正確にアウトライン化します。詳細な精緻化のために領域を分離するのに役立ちます。

設定済みモデル: sam_vit_b_01ec64.pthをAUTOモードで使用します。このバランスの取れたSAMモデルは、過剰なVRAM使用を抑えつつ優れたセグメンテーション精度を提供し、バッチ処理ワークフローに最適です。

SegmDetectorSEGS - セグメンテーションモデルを使用して画像の異なる領域を識別・分離し、ターゲット強化に使用します。SAMとUltralyticsモデルと連携して、精緻化のための正確なマスクを作成します。

画像処理ノード

VAEDecode - AIの内部画像表現を、表示・保存可能な通常のピクセルに変換します。

VAEEncode - その逆で、通常の画像をAIの内部形式に変換してさらに処理します。

ImageScale - 画像を特定の寸法にリサイズします。ワークフローフェーズ間の画像準備に役立ちます。

出力と整理ノード

SaveImage - 生成された画像をディスクに保存します。このワークフローには複数の保存ポイントがあり、異なる品質段階で結果をキャプチャできます。

サブディレクトリノード(PrimitiveString) - 保存された画像をカスタムサブディレクトリ/フォルダに整理できます。すべての画像が1つのフォルダにdumpされるのではなく、フェーズや画像タイプごとに別々のサブフォルダ(例:「Phase1_Base」、「Phase2_Refined」、「Final_Upscaled」)にルーティングできます。大規模バッチ出力を管理し、生産を整理する上で不可欠です。特に複数のプロジェクトで数百枚の画像を処理する場合に非常に価値があります。

デバッグメタデータ(LoRA Manager) - A1111互換形式で、画像内に生成設定、使用したLoRA、その他のメタデータをすべてキャプチャして保存します。これは以下の点で不可欠です:

  • 特定の結果を生み出した設定を追跡する

  • CivitAIのような画像共有プラットフォームとの互換性を確保する

  • 最高の生成結果を完全に再現可能に保つ

  • 手動でのデータ入力なしにLoRA情報を自動的に埋め込む

  • プロフェッショナルなワークフローのドキュメンテーション

このノードは、LoRA Managerの視覚的選択システムと最終画像のメタデータとのシームレスな統合を可能にし、成功した設定を決して見失わないようにします。

ルーティングおよび組織化ノード

ReroutePrimitive - ジャンクションボックスのように機能し、ワイヤーが複雑に交差することなく、1つのノードから複数の宛先にデータを送信できます。これによりワークフローが整理され、読みやすくなります。

バイパススイッチ - 何の接続も切り離すことなく、ワークフローの特定のセクションをオン/オフ切り替えられる特別なノードです。

メモリ管理ノード

SoftModelUnloader - 使用済みのAIモデルをVRAMから賢く削除し、次の処理フェーズのためにGPUメモリを解放します。

easy clearCacheAll - VRAMとシステムRAMの両方のキャッシュを包括的にクリアし、バッチ処理中のメモリ蓄積を防ぎます。

ワークフローステージ

フェーズ1:ベース画像生成

ワークフローは、選択したチェックポイントモデルとLoRAを使用して初期画像を生成することから始まります。このフェーズには以下が含まれます:

  1. テキストプロンプトの処理

  2. 指定した解像度での初期画像生成

  3. 最初のFaceDetailer処理(オプション)

  4. 初期画像の保存ポイント

トランジションブリッジ

フェーズ間では、ワークフローに以下が含まれます:

  • VRAMを解放するためのモデルアンロードノード

  • 必要に応じた画像形式変換

  • オプションのチェックポイントスワップ準備

フェーズ2:スーパー精緻化

第2フェーズでは、ベース画像をさらに高品質に仕上げます:

  1. フェーズ2モデルの読み込み(同じまたは異なるモデル可)

  2. フェーズ2 LoRAの読み込み(同じまたは異なるLoRA可)

  3. 高詳細度での画像から画像への精緻化

  4. 2回目のFaceDetailer処理(オプション)

  5. 最終アップスケーリング処理

  6. 最終画像の保存

クリーンアップステージ

すべての生成が完了した後:

  • 包括的なメモリクリーンアップ

  • 最終モデルのアンロード

  • 次のバッチ処理の準備のためのキャッシュクリア

使用例

ビジュアルLoRA実験モード

LoRA Managerのビジュアルプレビューを活用して、さまざまなLoRAの組み合わせを迅速にテストできます。視覚的に考える人やAuDHD/ADHDのユーザーに最適で、ファイル名を解釈する必要なく効果を即座に認識できます。自動メタデータキャプチャにより、すべての成功した実験が将来の使用に完全に文書化されます。

最大詳細モード

両方のフェーズで同じモデルとLoRAを有効にします。単一のチェックポイントから可能な限りすべての詳細を引き出すのに最適です。

ハイブリッド強化モード

各フェーズで異なるモデルを使用します。たとえば、ベース画像は汎用モデルで生成し、精緻化には写実性専用モデルを使用します。

スタイルブレンディングモード

フェーズ1で芸術的スタイルLoRAを適用し、フェーズ2で技術的強化LoRAに切り替えて、スタイル豊かで技術的に完璧な結果を得ます。

バッチ生産モード

フェーズを戦略的に無効化することで、大量の画像を生成する際の品質対速度の最適なバランスを見つけられます。

メモリ効率

このワークフローに配置されたメモリ管理ノードにより、以下が可能になります:

  • VRAMが不足することなく、大規模なバッチ(50〜200枚以上)を処理

  • RAMの枯渇によるシステムクラッシュを防止

  • 長時間の生成セッションでも一貫したパフォーマンスを維持

  • 中価格帯のハードウェアで高解像度ワークフローを実行

ワークフローは、各主要な遷移ポイントでメモリをクリアすることで、各フェーズを最大リソースで開始できるようにします。

技術的利点

自動メタデータシステム - A1111互換の完全なメタデータ埋め込みにより、手動ドキュメンテーションの負荷が削減されます。すべての画像が完全なプロヴェナンス追跡を備えた自己記述型となり、完璧な再現性とCivitAIとのプロフェッショナルな互換性を実現します。成功した設定を失うことはなく、手動でのパラメータ転記に時間を無駄にすることはありません。

ビジュアルLoRA管理 - 統合されたLoRA Managerサポートにより、ファイル名ベースのLoRA選択による認知的負荷が解消されます。ビジュアルプレビューにより実験が速く直感的になり、特にテキスト記憶より視覚記憶に優れる神経多様性のあるユーザーにとって非常に価値があります。メタデータシステムとのシームレスな統合により、すべてのLoRAが適切に文書化されます。

プロダクションレベルのメモリ最適化 - 戦略的に配置されたモデルアンローダーとRAMクリーナーにより、クラッシュなしで200〜400枚以上の画像をバッチ処理できます。夜間生成を安心して実行でき、バッチ処理中にVRAMやシステムメモリが枯渇することはありません。

モジュール性 - すべての主要なセクションは、ワークフローロジックを破壊することなく個別に有効/無効化できます。

スケーラビリティ - 1枚の画像を生成する場合でも、数百枚のバッチを処理する場合でも、メモリ管理により一貫したパフォーマンスを実現します。

柔軟性 - モデル、LoRA、設定をフェーズ間で切り替えても、ワークフロー全体を再構築する必要はありません。

品質管理 - 複数の保存ポイントにより、異なる精緻化段階の結果を比較し、最適な設定を調整できます。

メタデータ保持 - 保存された画像に完全な生成情報が埋め込まれ、再現性とプラットフォーム互換性が確保されます。

最良の実践

  1. ベースモデルを理解する - 開始前に、選択したベースモデルの最適なKSampler設定を把握してください。モデルのドキュメントやコミュニティ推奨値を確認し、ステップ、CFG、サンプラー、スケジューラの値を確認してください。ワークフローのデフォルト設定はすべてのモデルに最適とは限りません。

  2. ビジュアルLoRA選択を活用する - ファイル名を暗記するのではなく、LoRA Managerのサムネイルプレビューで効果を素早く特定してください。これにより実験が劇的に高速化し、認知的負荷が軽減されます。

  3. シンプルに始める - 完全な精緻化を有効にする前に、フェーズ1のみでプロンプトと設定をテストしてください。これにより、二重フェーズ処理に時間を投資する前にベース生成の品質を確認できます。

  4. メモリを監視する - VRAM使用量を確認し、ハードウェアに応じてオプションのステージを無効化する必要があるかどうかを判断してください。

  5. モデルを試す - 最初は同じチェックポイントを両方のフェーズで試し、その後異なる組み合わせを試して独自の効果を発見してください。モデルを切り替えるときはKSampler設定を調整することを忘れないでください。

  6. LoRAを戦略的にレイヤー化する - フェーズ1では汎用的なLoRA、フェーズ2では詳細強化用の専門LoRAを使用してください。ビジュアルプレビューシステムにより、効果的な組み合わせを簡単に構築できます。

  7. メタデータシステムを信頼する - 自動メタデータ埋め込みにより、成功した設定を手動で文書化する必要はありません。すべての画像が自己記述型です。

  8. バッチ処理 - メモリ管理システムはバッチ操作中に最大の効果を発揮します。夜間実行により生産性を最大化してください。

結論

Production Dual-Phase Refinerは、視覚的LoRA管理、自動メタデータ埋め込み、プロダクション規模のメモリ最適化という3つのコア原則に基づいたプロフェッショナルなAI画像生成アプローチです。単一の傑作画像の作成から、大量のバッチ処理まで、このワークフローはプロフェッショナルな信頼性で卓越した結果を提供します。

LoRA Manager統合は、LoRA選択をテキストベースのファイル名検索から、高速で視覚的認識へと変革します。特に視覚記憶に優れる神経多様性のあるユーザーにとって非常に価値があります。自動A1111互換メタデータ埋め込みは、すべての画像を完全なプロヴェナンス追跡を備えた自己記述型にし、手動ドキュメンテーションの負荷を排除し、完璧な再現性を実現します。戦略的なメモリ管理は、200〜400枚以上の画像を一晩でクラッシュなしにバッチ処理できる能力を実証しています。

柔軟な二重フェーズアーキテクチャ(フェーズ間で同じまたは異なるモデル/LoRAをサポート)と完全なモジュラー制御を組み合わせることで、このワークフローはあらゆるクリエイティブまたは生産シナリオに対応します。アマチュアの実験から、CivitAIのようなプロフェッショナルなコンテンツ作成まで、Production Dual-Phase Refinerは、あなたの野心に応じてスケールする品質、信頼性、直感的なユーザーエクスペリエンスを提供します。

実戦検証済み設定:このワークフローは、ESRGAN_4xアップスケーリング、最適化されたFaceDetailerパラメータ、バランスの取れたSAM/YOLO検出モデルなど、SDXL、Pony、Illustrious、NoobAIモデルファミリー全体で98%の成功率を達成した丁寧に調整された設定で事前構成されています。これらは理論的な設定ではなく、膨大な実際のバッチ処理を通じて洗練された実用的な設定です。

このモデルで生成された画像

画像が見つかりません。