Qwen Image Edit Comfyui Workflow

세부 정보

파일 다운로드

모델 설명

Qwen 이미지 편집 ComfyUI 워크플로우: 기본 설명

이 워크플로우는 Qwen 모델을 사용하여 ComfyUI로 이미지를 편집하는 방법을 보여주며, 주로 텍스트 프롬프트를 통한 스타일 변환과 컨디셔닝에 초점을 맞춥니다. 아래에는 프로세스의 구조화된 개요가 나와 있습니다:

1. 로더 섹션

  • 디퓨전 모델 로드: 사용 가능한 옵션 중 하나로 Qwen 이미지 편집 디퓨전 모델을 선택하고 로드합니다. 이 모델은 제공된 지시에 따라 이미지를 생성하고 편집하는 역할을 합니다.

  • CLIP 로드: 이미지-텍스트 컨디셔닝에 필요한 CLIP 모델을 로드합니다. 이 모델은 텍스트 프롬프트를 이미지의 특정 시각적 특성과 연결합니다.

  • VAE 로드: 잠재 이미지 표현을 시각적으로 볼 수 있는 이미지로 복원하기 위해 변분 오토인코더(VAE) 모델을 로드합니다.

2. 컨디셔닝 섹션

  • 텍스트 컨디셔닝: TextEncodeQwenImageEdit 노드를 사용하여 프롬프트를 입력합니다(예: "애니메이션 스타일로 변경"). 이를 통해 제공된 텍스트 설명에 따라 이미지를 수정할 수 있습니다.

  • 이미지 참조: 편집할 원본 이미지를 로드합니다. 필요한 경우 대상 편집을 위한 마스크를 선택적으로 제공할 수 있습니다.

3. 전처리

  • 메가픽셀로 스케일링: 참조 이미지를 목표 메가픽셀 크기로 조정하여 출력 해상도가 요구사항과 일치하도록 합니다.

4. 샘플러 섹션

  • 잠재 크기 선택기: 출력 크기(해상도) 및 강도, 시드와 같은 다른 샘플링 매개변수를 정의하여 무작위성과 일관성에 영향을 줍니다.

  • 스케줄러 및 샘플러 선택: 스케줄러와 샘플러를 구성합니다. 일반적인 설정은 다음과 같습니다:

    • 스케줄러: 스텝 수 및 노이즈 제거 강도를 제어합니다.

    • 샘플러: 샘플링 프로세스에 적합한 알고리즘을 선택합니다(예: Euler).

5. 생성 노드

  • 랜덤 노이즈: 선택한 시드와 일치하는 랜덤 노이즈로 프로세스를 초기화합니다.

  • CFG 가이드: CLIP 컨디셔닝과 프롬프트를 기반으로 대상 이미지 방향으로 프로세스를 안내합니다.

6. 디코딩 및 출력

  • 샘플러 및 디코더: 생성된 잠재 이미지는 VAE에 의해 디코딩되어 최종 시각적 출력으로 변환됩니다.

  • 저장/내보내기: 결과 이미지를 저장하여 추가 사용 또는 공유에 활용합니다.


이 워크플로우는 텍스트 프롬프트에 기반한 디퓨전 모델을 활용하여, 직관적이고 노드 기반의 인터페이스로 유연한 이미지 편집을 가능하게 합니다. 모듈식 구조 덕분에 각 단계를 맞춤화하여 다양한 창의적 및 기술적 응용이 가능합니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.