PH's Archviz x AI ComfyUI Workflow (FLUX1.TOOLS + CogVideoX)
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
이 ComfyUI 워크플로우는 건축 이미지에 대한 1) 이미지 생성, 2) 인페인팅, 3) 아웃페인팅, 4) 이미지에서 영상 생성 기능을 모두 통합하여 사용할 수 있도록 설계되었습니다. 다른 분들께도 유용할 수 있습니다. 이 워크플로우는 깊이 생성을 기반으로 이미지를 생성하며(모델 로더(섹션 I)에서 LoRA/모델을 전환하거나 예를 들어 캐니로 사용자 정의 가능), 생성된 출력은 이후 코그비디오X로 전달되기 전 인페인팅/아웃페인팅할 수 있습니다. 기본 이미지 입력 예시가 일부 포함되어 있습니다.
이 워크플로우를 사용하는 방법을 보여주는 동영상은 아래에서 확인할 수 있습니다:
변경사항
v0.55_241219
CONFIG에 img2video "모드 4"를 추가하여 BASE IMAGE INPUT에서 VIDEO OUTPUT으로 전환 가능(이 경우 IMAGE OUTPUT은 끄는 것이 권장됨)
cogvideox CONFIG에 CAMERA MOVEMENT 선택 기능을 추가하여 섹션 II의 미리 정의된 프롬프트가 NimVideo에서 생성한 카메라 모션 LoRA를 통해 움직임을 구현 가능(아래 링크 참조)
MOTION LORA STRENGTH를 추가, 0.6-0.8에서 가장 잘 작동하며 때로는 1.0도 사용 가능. 사용 리소스에 추가함
IMAGE INPUTS를 더 간소화하여 redux를 제외한 모든 입력을 BASE IMAGE INPUT을 통해 제공
v0.5_241213
인페인팅 문제 수정: 마스킹으로 인해 보였던 흐릿한 출력이 제거됨. 이제 미리보기/저장 노드에서 정확한 출력을 확인 가능 코 cough
IMAGE RESIZE RESOLUTION 설정을 간소화하여 기본값을 1920 픽셀(비율 유지)로 설정
REDUX STRENGTH를 CONFIG에서 쉽게 조정 가능
LORA STRENGTH를 CONFIG에서 쉽게 조정 가능
비디오 출력용 자동 비율 설정 추가: 입력에 따라 풍경/세로 비율 자동 생성
비디오 출력을 간소화: 프로세스 노드를 COGVIDEOX OUTPUT로 이동하여 rgthree의 빠른 바이패스러에서 한 번의 클릭으로 활성화/비활성화 가능
인페인팅 및 아웃페인팅 입력을 결합하여 공간 절약
표준 이미지 저장 노드 추가 (저화질/LQ: jpg 72 dpi, 고화질/HQ: png 300 dpi, 메타데이터/워크플로우 포함)
v0.4_241129
적절한 인페인팅 기능 추가: 이제 3~4번 인페인팅 후에도 이미지가 손상되지 않음
FLUX1.Redux가 이 워크플로우에 포함됨 (BLACK 노드)
이미지 생성 시 프롬프트를 쉽게 전환 가능
워크플로우 최적화
v0.3_241122
- 초기 릴리즈
이 워크플로우는 동영상에서 보여준 대로 VRAM 리소스를 많이 요구한다는 점에 유의하세요.
자원:
사용된 모델:
체크포인트
flux1-dev.safetensors
flux1-depth-dev.safetensors
flux1-fill-dev.safetensors
-> (FP8 버전: https://huggingface.co/boricuapab)
LoRA
flux1-depth-dev-lora.safetensors
pytorch_lora_weights.safetensors (https://huggingface.co/NimVideo/cogvideox1.5-5b-prompt-camera-motion/blob/main/pytorch_lora_weights.safetensors)
CogVideoX
- CogVideoX-5b-1.5-I2V
CLIP
t5xxl_fp16.safetensors
clip_l.safetensors
VAE
- ae.safetensors
사용된 커스텀 노드:
GitHub - ltdrdata/ComfyUI-Manager
GitHub - rgthree/rgthree-comfy
GitHub - chrisgoringe/cg-image-picker
GitHub - kijai/ComfyUI-KJNodes
GitHub - kijai/ComfyUI-CogVideoXWrapper
GitHub - yolain/ComfyUI-Easy-Use
FLUX 등은 BlackForestLabs에서 다운로드
Kijai의 CogVideoX1_5i2v (영상 관련 자료) + KJNodes
rgthree-comfy (보다 편리한 사용을 위해)
chrisgoringe의 cg-image-picker (미리보기 선택용)
yolain의 easy-use 노드 및
theUpsiders Logic 노드 (자동화 기능용)
1920x1440px 이미지와 49프레임 길이의 1360x768px 비디오를 인페인팅/아웃페인팅 없이 생성하는 데 4090에서 약 530초가 소요되며, VRAM 최대 사용량은 약 23GB입니다. 따라서 현재로선 고사양 리소스가 필요합니다. 업데이트 정보를 원하시면 제 인스타그램을 방문해주세요.