Z-image-hires Workflow

詳細

ファイルをダウンロード

モデル説明

🚀 Z-Image Turbo FP8 高解像度ワークフロー(低VRAM最適化)

これは、低VRAMユーザー向けに設計された高効率なComfyUIワークフローです。FP8量子化モデルLatent Upscale技術を活用することで、リソース消費を最小限に抑えながら高解像度画像(1024x1792)を迅速に生成します。

✨ 主な特徴

  • 極めて低いVRAM使用量:モデルおよびテキストエンコーダーを完全にFP8で構成し、メモリ使用量を大幅に削減。

  • 驚異的な高速処理:Turboモデルと効率的なサンプリングステップに最適化。

  • Hires FixワークフローLatent Upscale + 2nd Pass KSamplerを使用して、重いVRAMコストをかけずに鮮明なディテールを実現。

  • AuraFlowアーキテクチャModelSamplingAuraFlowノードで最適化済み。


📂 必要なモデルとダウンロード

ワークフローを正しく動作させるには、以下のモデルをダウンロードし、対応するComfyUIフォルダに配置してください。

1. UNetモデル(models/unet/に配置)

2. CLIP/テキストエンコーダー(models/clip/に配置)


⚙️ 主な設定と構成

このワークフローは2段階の処理システムで動作します。最良の結果を得るには、以下の設定に従ってください。

🔹 第1段階:ベース生成

  • Latentサイズ:計算リソースを節約するために、初期解像度を低め(例:512x896)で生成。

🔹 第2段階:Latentアップスケール

  • アップスケール方法LatentUpscaleByを使用。

  • スケール係数:デフォルトは2(最終出力解像度は1024x1792)。

🔹 第3段階:Hires Fix(リファイナー)

このステップは画像の明瞭さとディテールに不可欠です:

  • サンプラーres_multistep(強く推奨)。

  • ノイズ除去(Denoise):推奨範囲は0.5 - 0.6

    • < 0.5:変化が最小限;画像がややぼやける可能性あり。

    • > 0.6:より多くのディテールを追加するが、値が高すぎると画像構造が変化したり、幻覚が発生する可能性あり。


📊 パフォーマンスベンチマーク

実際のテストデータに基づく:

GPU出力解像度所要時間
NVIDIA RTX 5070 Ti1024 x 17928~9秒


📝 使用上のヒント

  1. メモリ管理:VRAMが極端に限られている場合、バックグラウンドに他の大規模モデルを読み込まないようにしてください。

  2. プロンプトの記述:このワークフローはQwenテキストエンコーダーを使用しており、自然言語理解能力が非常に高いです。詳細で文節ベースのプロンプトが非常に効果的です。

  3. トラブルシューティング:画像のディテールが崩れたり「燃えている」ように見える場合は、2番目のKSamplerのdenoise値を少し下げてみてください。

このモデルで生成された画像

画像が見つかりません。