Flux Full Suite
세부 정보
파일 다운로드
모델 설명
여기에서 latentsync의 더 빠른 버전을 찾을 수 있습니다.
GeekyGhost/ComfyUI-Geeky-LatentSyncWrapper: Latent Sync를 위한 ComfyUI 래퍼, 일부 개선 사항 포함.
이것은 코드에 일부 최적화가 적용된 1.5 모델입니다.
이 색인에 포함된 모든 자산은 현재 이 워크플로우로 생성되었습니다. 초기 이미지는 Flux Krea로 생성하고, Wan LCM으로 애니메이션을 적용하며, MMAudio로 사운드 효과를 추가하고, Ace Step으로 음악을 생성했습니다. Kokoro TTS로 생성된 음향을 사용하여 LatentSync로 입술 동기화를 만들고, 이를 비디오 편집기에서 모두 결합하여 내보냈습니다. 각각 생성되고 층층이 겹쳐진 자산을 보여주려고 노력했습니다.
안녕하세요, 이건 제 완전한 Flux 워크플로우입니다. 일반 이미지 생성을 위해 제가 만든 사용자 정의 flux schnell 모델을 사용하고, img2img 편집을 위한 flux kontext 그룹, flux dev fill을 사용한 인페인팅 및 아웃페인팅 그룹을 포함합니다. 더 큰 모델은 제 노트북에 너무 무거워서 양자화된 버전을 사용합니다.
또한, Reactor를 사용하여 이미지 및 비디오의 얼굴 복원 및 교체 그룹도 있습니다. Onnyx 문제를 겪을 수 있으므로 지원을 위해 레포지토리를 확인하거나 이 부분을 삭제할 수 있습니다.
다음은 입술 동기화를 위한 latentsync입니다. 비디오와 오디오 입력을 받아 입술 동기화 비디오를 생성합니다. 입술 동기화 과정에서 잘려나간 비디오 부분을 마지막에 다시 추가하여 부드러운 전환을 구현하도록 설정했습니다. 그 다음 얼굴 복원 또는 교체 과정을 거칩니다.
자신의 TTS가 없다면 Kokoro TTS 노드를 추가했습니다. 필요하지 않다면 단순히 삭제하시면 됩니다. 이 노드에는 미니 음성 수정기 노드가 포함되어 있습니다.
MMAudio를 추가하여 텍스트 입력 및 비디오 입력을 사용하여 비디오용 사운드 효과 및 기타 오디오를 생성했습니다.
비디오 생성을 위해 Wan을 추가했습니다. 5단계로도 양질의 결과를 내는 gguf 모델들이 로컬에서 매우 빠르게 실행됩니다.
음악 생성을 위해 Ace Step을, 더 다양한 오디오 옵션을 위해 Stable Audio를 추가했습니다.
Geeky Remb 노드를 추가했습니다.
















