The One-Image Workflow: A Forge-Style Static Design for Wan Image, Z-Image, Qwen-Image, Flux2 & Others

세부 정보

파일 다운로드

모델 설명

원 이미지 워크플로우 소개: Wan 2.1/2.2, Z-Image, Qwen-Image, Flux2 및 기타 모델용 포지 스타일 정적 디자인

작성자: Iory98

테스트 환경: Windows 11, ComfyUI 버전: v0.4.0 | 프론트엔드 버전: v1.33.13

워크플로우 내부에 전체 가이드가 포함되어 있습니다.

소개 및 동기: 더 이상 떡국처럼 복잡하지 않게!

ComfyUI는 AI 생성을 위한 강력한 플랫폼이지만, 그래프 기반 구조로 인해 초보자에게는 intimidating할 수 있습니다. Forge WebUI나 A1111에서 온 사용자라면, “떡국 같은” 워크플로우를 관리하는 것이 번거로운 일로 느껴질 수 있습니다. 저는 플랫폼이 그래프를 설계하는 데 집중하게 만들기보다, 사용자가 이미지 생성에만 집중할 수 있어야 한다고 믿었습니다.

이를 해결하기 위해 원 이미지 워크플로우를 개발했습니다. 목표는 사용자 인터페이스처럼 작동하는 워크플로우를 만드는 것이었습니다. 최신 ComfyUI 서브그래프 기능을 활용해 혼란스러운 구조를 깔끔하고 정적인 작업 공간으로 정리했습니다.

왜 “원 이미지”인가요?

이 워크플로우는 양보다 질에 초점을 맞춥니다. 50장의 이미지를 무작정 생성하는 대신, 완벽한 단일 이미지를 제작하기 위한 구조화된 3단계 파이프라인을 제공합니다: 구성 생성 → 모델 기반 하이레스 픽스로 세부사항 개선 → 모듈식 타일링을 사용해 4K로 업스케일링합니다.

Wan 2.1 및 Wan 2.2(텍스트-이미지)에 최적화되었지만, 이 워크플로우는 Qwen-Image, Z-Image 및 단일 텍스트 인코더가 필요한 모든 모델과 호환됩니다.

핵심 철학: 3단계 파이프라인

이 워크플로우는 단순히 이미지를 생성하는 것에 그치지 않고, 완벽하게 다듬는 것을 목표로 합니다. 시간과 VRAM을 절약하기 위해 모듈식 로직을 따릅니다:

· 1단계 - 구성 (저해상도): 저해상도(예: 1088x1088)로 이미지 배치를 생성합니다. 빠르며, 가장 좋은 구성만 선택할 수 있습니다.

· 2단계 - 하이레스 픽스: 선호하는 이미지를 하이레스 픽스 모듈에 통과시켜 세부사항을 추가하고 텍스처를 정제합니다.

· 3단계 - 모듈식 업스케일: 최종적으로 Ultimate SD Upscale 모듈을 사용해 2K 또는 4K 해상도로 확대합니다.

이 단계들을 분리하면, 4K 생성에 몇 분을 기다린 후 손이 왜곡되었음을 발견하는 불상사를 방지할 수 있습니다.

“중첩” 인터페이스: 어떻게 탐색하나요?

이 워크플로우의 가장 독특한 기능은 중첩된 미리보기 시스템입니다. 화면 공간을 절약하기 위해 세 개의 이미지 비교 노드를 겹쳐 배치했습니다. 노드를 이동할 필요 없이, 위쪽 노드를 접으면 그 뒤에 있는 노드가 나타납니다.

· 레이어 1(상단) – 현재 vs 이전: 최근 생성된 이미지와 그 전 이미지를 비교합니다.
동작: 노드 헤더의 최소화 아이콘을 클릭하여 이 레이어를 숨기고 레이어 2를 드러냅니다.

· 레이어 2(중간) – 하이레스 픽스 vs 원본: 2단계 개선 결과와 기초 이미지를 비교합니다.
동작: 이 레이어를 최소화하면 레이어 3이 나타납니다.

· 레이어 3(하단) – 업스케일된 이미지 vs 원본: 최종 초고해상도 출력과 입력 이미지를 비교합니다.

컨트롤 패널 (서브그래프)

워크플로우는 7개의 색상 코드로 구분된 서브그래프로 구성되어 있습니다. 웹 브라우저의 탭처럼 생각하시면 됩니다. 설정을 변경하려면 확장하고, 작업 공간을 깔끔하게 유지하려면 접어두세요.

1. Wan_Main_Settings (대시보드)

· 상태: 항상 확장

· 기능: 90% 이상 사용하는 파라미터를 포함한 홈 화면입니다:

o 프롬프트: 긍정적 텍스트 입력

o 생성 데이터: 시드, 샘플러, 스케줄러, CFG, 스텝

o 이미지 크기: 기초 해상도를 여기서 설정

o 토글 스위치: 와이어를 끊지 않고도 리파이너, 하이레스 픽스, 업스케일링 단계를 빠르게 활성화/비활성화

2. Wan_Model_Loaders (설정 변경 시작점)

· 기능: 체크포인트 로딩을 처리합니다.

· 듀얼 스테이지 로딩: 구조를 위한 메인 모델(고노이즈)과 세부사항을 위한 리파이너 모델(저노이즈)을 동시에 로드 가능

· 형식 자유: GGUF와 Safetensors를 혼합 사용 가능. 예: 메인 모델로 GGUF, 리파이너로 Safetensors를 로드하여 양자화 차이를 테스트 가능

3. Wan_Model_Parameters (고급 조정)

· 기능: 모델의 기술적 설정

· 기능:

o 모델 형식 선택: GGUF vs Safetensors 형식 선택

o MagCache 최적화: VRAM 사용량 및 속도 관리 설정

o 기본 LoRA 스택: “항상 활성화” LoRA(예: Lightning 또는 Turbo LoRA)를 위한 3개 슬롯의 묶음

4. Wan_Unified_LoRA_Stack

· 기능: 중앙 집중식 LoRA 로더

· 논리: 메인 및 리파이너 모델에 별도의 LoRA를 관리하는 대신, 이 스택은 스타일 LoRA를 두 모델 모두에 적용합니다. 최대 6개의 LoRA를 지원합니다. 물론 위에서 언급한 기본(내장) LoRA와 병행 사용 가능합니다.

· 참고: 특정 모델에만 LoRA를 적용해야 하는 경우, 워크플로우에 포함된 외부 Power LoRA 로더를 사용하세요.

5. Wan_NAG_Settings (네거티브 프롬프팅)

· 기능: 이미지에서 제외할 요소를 관리합니다.

· 기능: NAG(Normalized Attention Guidance) 설정을 포함하여, 일반적인 방법보다 네거티브 프롬프트에 더 잘 따르는 경우가 많습니다. 이미지 파일명 접두사 및 저장 경로도 관리합니다.

6. Wan_HiResFix_Settings (2단계)

· 기능: 1단계에서 생성된 이미지를 정제합니다.

· 권장: 선택한 “초안” 이미지를 확대할 때 사용하세요. 저해상도 버전에 존재하지 않았던 세부사항을 추가하기 위해 재노이징 기술을 사용합니다.

7. Wan_Upscaler_Settings (3단계)

기능: 최종 마무리; 모델의 해상도 한계를 초월하여 이미지를 업스케일링합니다.

모듈: Ultimate SD Upscale 사용

논리: VRAM 부족 없이 4K 해상도로 확대하기 위한 타일링 업스케일링을 가능하게 합니다. 원본 이미지 또는 하이레스 픽스된 이미지를 이 모듈에 입력할 수 있습니다.

요구 사항 및 설치

이 워크플로우를 사용하려면 ComfyUI Manager가 설치되어 있어야 합니다. 워크플로우를 로드하면 “Missing Custom Nodes Install”을 클릭하세요.

사용된 주요 커스텀 노드:

· rgthree-comfy: 무음 스위치 및 이미지 비교 노드용

· ComfyUI Impact Pack: 고급 워크플로우 로직용

· ComfyUI-Easy-Use: 파라미터 처리 간소화용

· ComfyUI-KJNodes: UI 개선용

· UltimateSDUpscale: 3단계 업스케일링용

· ComfyUI-GGUF: GGUF 양자화 모델 사용 시 필수

· Was Node Suite: 다양한 I/O 작업용

빠른 시작 가이드

  1. 모델 로드: Model_Loaders 서브그래프를 열고 Wan 2.1(또는 다른) 체크포인트를 선택하세요.

  2. 해상도 설정: Main_Settings에서 빠른 미리보기 해상도(예: 832x1216 또는 1024x1024)를 설정하세요.

  3. 프롬프트 입력: Main_Settings 또는 연결된 긍정적 프롬프트 필드에 텍스트를 입력하세요.

  4. 생성: Queue Prompt를 누르세요.

  5. 검토: 상단의 현재 vs 이전 미리보기를 확인하세요.

  6. 정제(선택 사항): 시드가 마음에 들면 Main_Settings에서 "Enable Hi-Res Fix"를 켜고 다시 생성하여 세부사항을 다듬으세요. 상단 미리보기를 접어 결과를 확인하세요.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.