Comfyui, Pose Creator V2 Workflow using TCD Sampler
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
제 1세대 포즈 크리에이터와 비교하면, 아래와 같은 차이점이 있습니다:
V2는 1단계 워크플로우입니다.
V2는 더 빠릅니다. 20분 안에 15개의 포즈를 생성합니다(포즈 크리에이터는 40분 걸렸습니다).
V2는 Hyper-SD LoRA + TCD 샘플러를 사용합니다(이미지 생성 시간을 단축하기 위해).
샘플 이미지 품질은 제 1세대 포즈 크리에이터만큼 좋지 않지만, 저에게는 충분히 좋습니다.
TCD GitHub 링크:
GitHub - JettHu/ComfyUI-TCD: ComfyUI TCD 구현
Hyper-SD GitHub 링크:
ByteDance/Hyper-SD at main (huggingface.co)
이 워크플로우는 뼈 구조, 깊이 맵, 라인아트 파일을 1단계로 생성하도록 설계되었습니다.
좋은 포즈를 가진 이미지를 보유하고 있으며, ControlNet을 사용해 해당 포즈를 재현하고 싶다면, 이 모델은 당신을 위해 설계되었습니다.
이 워크플로우는 "hand refiner" 전처리기를 사용해 포즈를 재구성하도록 설계되었으므로, 출력 파일은 대부분의 경우 손 문제를 자동으로 수정할 수 있습니다. (원본 이미지에 손이 이상해도 이 워크플로우에서는 문제되지 않습니다)
모델 구성 요소:
JSON 형식의 포즈 크리에이터 V2 워크플로우
PNG 파일 형식의 포즈 크리에이터 V2 워크플로우
출력 예시 - 4개의 포즈
TCD LoRA 및 Hyper-SD LoRA
TCD를 사용한 T2I 워크플로우 예시(TCD를 시도해보세요)
워크플로우 입력: 원본 포즈 이미지
워크플로우 출력:
포즈 예시 이미지(저의 경우, 벌거벗고 대머리 여성)
뼈 구조 이미지(ControlNet Openpose용)
깊이 맵 이미지(ControlNet Depth용)
리얼리스틱 라인아트 이미지(ControlNet Lineart용)
샘플 이미지(ControlNet Openpose + Depth를 사용해 생성된 예시)
스위치로 구분된 2개의 하위 워크플로우:
포즈 RAW 이미지 얻기 위한 일반 T2I(일반 T2I 워크플로우만 사용)
포즈 크리에이터(위에서 언급한 5가지 출력을 생성)

사용법:
“일반 T2I로 포즈 RAW 이미지 얻기” 워크플로우에서 이미지 출력 폴더를 지정하세요.
→ 이 폴더는 다음 워크플로우의 입력 폴더가 됩니다.

“포즈 크리에이터” 워크플로우에서 이미지 입력 폴더를 지정하세요.

“최종 처리” 워크플로우에서 이미지 출력 폴더를 지정하세요.
→ 예시, 뼈 구조, 깊이 맵, 라인아트, 샘플 이미지가 모두 여기에 저장됩니다.

출력 이미지 폴더 예시:
K:\SD\comfyui\Creations\RAW
K:\SD\comfyui\Creations\Pose
(저의 경우 최종 예시, 뼈 구조, 깊이 맵, 라인아트, 샘플 이미지 모두 Pose 폴더에 저장됩니다)
최종 출력 파일명 형식 - (Pose_출력 유형), 예시:
Standing_example
Standing_bone_skeleton
Standing_depth_map
Standing_lineart
Standing_showcase

입력/출력 폴더 및 파일명 설정이 끝나면, 이제 남은 것은 일반 T2I 파라미터만입니다.

그리고 TCD LoRA 또는 Hyper-SD LoRA를 LoRA 폴더에 넣으면, 이 워크플로우의 LoRA 노드는 다음과 같습니다.

모든 설정이 끝나면 워크플로우를 실행할 준비가 됩니다.
포즈 이미지를 보유하고 있다면, “포즈 크리에이터” 워크플로우를 위해 만들었던 입력 폴더에 넣으세요.
스위치를 통해 “포즈 크리에이터”를 활성화하세요.

“pose” 폴더 이름을 변경하고, “RAW” 폴더 내 파일을 수정하며, “포즈 크리에이터” 워크플로우의 프롬프트를 수정하면 다음 실행을 위한 준비가 끝납니다.
참고:
처음에 이미지 출력 폴더를 따로 만들 필요가 없습니다. 워크플로우가 자동으로 생성합니다.
이 워크플로우는 사용자 친화적이지는 않지만, 각 단계는 이해하기 쉽고, 무엇보다도 귀하의 필요에 맞게 쉽게 수정할 수 있습니다.
4060ti 16GB 및 80GB RAM 환경에서, 15개의 포즈를 완료하는 데 약 20분이 걸립니다(제 1세대 포즈 크리에이터보다 생성 시간의 50%만 소요됨).
이 워크플로우는 뼈 구조 파일을 .json 형식으로 출력할 수 없습니다.
출력 이미지에 여전히 손이나 기타 해부학적 오류가 있다면, WebUI a1111의 OpenPose 에디터 확장 기능을 사용해야 합니다.
원본 포즈 이미지의 크기는 달라도 괜찮습니다. 예를 들어, 512*768 또는 768*512 이미지를 “RAW” 폴더에 넣어도, 워크플로우는 가로/세로 비율을 변경하지 않고도 정상 작동합니다.
“포즈 크리에이터” 워크플로우의 샘플 생성 시, OpenPose만 사용하는 것이 좋습니다. 2개의 ControlNet 유닛을 사용하면 피사체의 옷이 이상하게 보일 수 있습니다.




