PH's Archviz x AI ComfyUI Workflow (FLUX1.TOOLS + CogVideoX)

세부 정보

파일 다운로드

모델 설명

이 ComfyUI 워크플로우는 건축 이미지에 대한 1) 이미지 생성, 2) 인페인팅, 3) 아웃페인팅, 4) 이미지에서 영상 생성 기능을 모두 통합하여 사용할 수 있도록 설계되었습니다. 다른 분들께도 유용할 수 있습니다. 이 워크플로우는 깊이 생성을 기반으로 이미지를 생성하며(모델 로더(섹션 I)에서 LoRA/모델을 전환하거나 예를 들어 캐니로 사용자 정의 가능), 생성된 출력은 이후 코그비디오X로 전달되기 전 인페인팅/아웃페인팅할 수 있습니다. 기본 이미지 입력 예시가 일부 포함되어 있습니다.

이 워크플로우를 사용하는 방법을 보여주는 동영상은 아래에서 확인할 수 있습니다:

변경사항


v0.55_241219

  • CONFIG에 img2video "모드 4"를 추가하여 BASE IMAGE INPUT에서 VIDEO OUTPUT으로 전환 가능(이 경우 IMAGE OUTPUT은 끄는 것이 권장됨)

  • cogvideox CONFIG에 CAMERA MOVEMENT 선택 기능을 추가하여 섹션 II의 미리 정의된 프롬프트가 NimVideo에서 생성한 카메라 모션 LoRA를 통해 움직임을 구현 가능(아래 링크 참조)

  • MOTION LORA STRENGTH를 추가, 0.6-0.8에서 가장 잘 작동하며 때로는 1.0도 사용 가능. 사용 리소스에 추가함

  • IMAGE INPUTS를 더 간소화하여 redux를 제외한 모든 입력을 BASE IMAGE INPUT을 통해 제공

v0.5_241213

  • 인페인팅 문제 수정: 마스킹으로 인해 보였던 흐릿한 출력이 제거됨. 이제 미리보기/저장 노드에서 정확한 출력을 확인 가능 코 cough

  • IMAGE RESIZE RESOLUTION 설정을 간소화하여 기본값을 1920 픽셀(비율 유지)로 설정

  • REDUX STRENGTH를 CONFIG에서 쉽게 조정 가능

  • LORA STRENGTH를 CONFIG에서 쉽게 조정 가능

  • 비디오 출력용 자동 비율 설정 추가: 입력에 따라 풍경/세로 비율 자동 생성

  • 비디오 출력을 간소화: 프로세스 노드를 COGVIDEOX OUTPUT로 이동하여 rgthree의 빠른 바이패스러에서 한 번의 클릭으로 활성화/비활성화 가능

  • 인페인팅 및 아웃페인팅 입력을 결합하여 공간 절약

  • 표준 이미지 저장 노드 추가 (저화질/LQ: jpg 72 dpi, 고화질/HQ: png 300 dpi, 메타데이터/워크플로우 포함)

v0.4_241129

  • 적절한 인페인팅 기능 추가: 이제 3~4번 인페인팅 후에도 이미지가 손상되지 않음

  • FLUX1.Redux가 이 워크플로우에 포함됨 (BLACK 노드)

  • 이미지 생성 시 프롬프트를 쉽게 전환 가능

  • 워크플로우 최적화

v0.3_241122

  • 초기 릴리즈

이 워크플로우는 동영상에서 보여준 대로 VRAM 리소스를 많이 요구한다는 점에 유의하세요.


자원:

사용된 모델:

체크포인트

LoRA

CogVideoX

  • CogVideoX-5b-1.5-I2V

CLIP

  • t5xxl_fp16.safetensors

  • clip_l.safetensors

VAE

  • ae.safetensors

사용된 커스텀 노드:

  • GitHub - ltdrdata/ComfyUI-Manager

  • GitHub - rgthree/rgthree-comfy

  • GitHub - chrisgoringe/cg-image-picker

  • GitHub - kijai/ComfyUI-KJNodes

  • GitHub - kijai/ComfyUI-CogVideoXWrapper

  • GitHub - yolain/ComfyUI-Easy-Use


FLUX 등은 BlackForestLabs에서 다운로드

Kijai의 CogVideoX1_5i2v (영상 관련 자료) + KJNodes

rgthree-comfy (보다 편리한 사용을 위해)

chrisgoringe의 cg-image-picker (미리보기 선택용)

yolain의 easy-use 노드 및

theUpsiders Logic 노드 (자동화 기능용)

1920x1440px 이미지와 49프레임 길이의 1360x768px 비디오를 인페인팅/아웃페인팅 없이 생성하는 데 4090에서 약 530초가 소요되며, VRAM 최대 사용량은 약 23GB입니다. 따라서 현재로선 고사양 리소스가 필요합니다. 업데이트 정보를 원하시면 제 인스타그램을 방문해주세요.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.