🚀 Z-Image Turbo FP8 高解像度ワークフロー（低VRAM最適化）

これは、低VRAMユーザー向けに設計された高効率なComfyUIワークフローです。FP8量子化モデルとLatent Upscale技術を活用することで、リソース消費を最小限に抑えながら高解像度画像（1024x1792）を迅速に生成します。

✨ 主な特徴

極めて低いVRAM使用量：モデルおよびテキストエンコーダーを完全にFP8で構成し、メモリ使用量を大幅に削減。
驚異的な高速処理：Turboモデルと効率的なサンプリングステップに最適化。
Hires Fixワークフロー：Latent Upscale + 2nd Pass KSamplerを使用して、重いVRAMコストをかけずに鮮明なディテールを実現。
AuraFlowアーキテクチャ：ModelSamplingAuraFlowノードで最適化済み。

📂 必要なモデルとダウンロード

ワークフローを正しく動作させるには、以下のモデルをダウンロードし、対応するComfyUIフォルダに配置してください。

1. UNetモデル（`models/unet/`に配置）

ファイル名：z-image-turbo-fp8-e4m3fn.safetensors
ダウンロード：HuggingFace - Z-Image-Turbo-FP8

2. CLIP／テキストエンコーダー（`models/clip/`に配置）

ファイル名：qwen3-4b-fp8-scaled.safetensors
ダウンロード：HuggingFace - Qwen3-4B-FP8

⚙️ 主な設定と構成

このワークフローは2段階の処理システムで動作します。最良の結果を得るには、以下の設定に従ってください。

🔹 第1段階：ベース生成

Latentサイズ：計算リソースを節約するために、初期解像度を低め（例：512x896）で生成。

🔹 第2段階：Latentアップスケール

アップスケール方法：LatentUpscaleByを使用。
スケール係数：デフォルトは2（最終出力解像度は1024x1792）。

🔹 第3段階：Hires Fix（リファイナー）

このステップは画像の明瞭さとディテールに不可欠です：

サンプラー：res_multistep（強く推奨）。
ノイズ除去（Denoise）：推奨範囲は0.5 - 0.6。
- < 0.5：変化が最小限；画像がややぼやける可能性あり。
- > 0.6：より多くのディテールを追加するが、値が高すぎると画像構造が変化したり、幻覚が発生する可能性あり。

📊 パフォーマンスベンチマーク

実際のテストデータに基づく：

GPU｜出力解像度｜所要時間
NVIDIA RTX 5070 Ti｜1024 x 1792｜8～9秒

📝 使用上のヒント

メモリ管理：VRAMが極端に限られている場合、バックグラウンドに他の大規模モデルを読み込まないようにしてください。
プロンプトの記述：このワークフローはQwenテキストエンコーダーを使用しており、自然言語理解能力が非常に高いです。詳細で文節ベースのプロンプトが非常に効果的です。
トラブルシューティング：画像のディテールが崩れたり「燃えている」ように見える場合は、2番目のKSamplerのdenoise値を少し下げてみてください。

モデルタイプ	ワークフロー
ベースモデル	ZImageTurbo
公開日	11/29/2025

Z-image-hires Workflow

詳細

ファイルをダウンロード

モデル説明

🚀 Z-Image Turbo FP8 高解像度ワークフロー（低VRAM最適化）

✨ 主な特徴

📂 必要なモデルとダウンロード

1. UNetモデル（`models/unet/`に配置）

2. CLIP／テキストエンコーダー（`models/clip/`に配置）

⚙️ 主な設定と構成

🔹 第1段階：ベース生成

🔹 第2段階：Latentアップスケール

🔹 第3段階：Hires Fix（リファイナー）

📊 パフォーマンスベンチマーク

📝 使用上のヒント

このモデルで生成された画像

Z-image-hires Workflow

詳細

ファイルをダウンロード

モデル説明

🚀 Z-Image Turbo FP8 高解像度ワークフロー（低VRAM最適化）

✨ 主な特徴

📂 必要なモデルとダウンロード

1. UNetモデル（models/unet/に配置）

2. CLIP／テキストエンコーダー（models/clip/に配置）

⚙️ 主な設定と構成

🔹 第1段階：ベース生成

🔹 第2段階：Latentアップスケール

🔹 第3段階：Hires Fix（リファイナー）

📊 パフォーマンスベンチマーク

📝 使用上のヒント

このモデルで生成された画像

1. UNetモデル（`models/unet/`に配置）

2. CLIP／テキストエンコーダー（`models/clip/`に配置）