Swiss Army Knife AV Studio WAN 2.2 ++

세부 정보

파일 다운로드

모델 설명

참고: 이 문서는 의도적으로 철저하게 작성되었습니다. 길게 느껴질 수 있지만, 이 워크플로우의 모든 가치를 최대한 활용하는 데 도움이 됩니다.

서론

이 가이드는 이전의 Poser 및 다중 세그먼트 시나리오 워크플로우 컬렉션을 기반으로 한 완전한 기능을 갖춘 다중 장면 AV 클립 편집 워크플로우를 문서화한 것입니다. 핵심 아이디어는 그대로 유지되지만, 많은 변경 사항이 있습니다. 이전에는 사용 방법을 게시하지 않았는데, 이 문서는 포괄적인 매뉴얼로 대체됩니다.

이 워크플로우는 다양한 시나리오에 빠르고 템플릿 기반이며 사용자 정의 가능한 접근을 제공하면서도 고품질이고 일관된 AV 영상을 생성하기 위한 검증된 도구들을 손쉽게 사용할 수 있도록 합니다.

기능

  • 코기, 딥스로트, 도기, 미션어리, 포징을 포함한 17개의 장면. 일부는 완전한 스토리이며, 다른 일부는 독립된 세그먼트로, 여러 포즈를 조합하여 길고 매력적인 내러티브를 만들 수 있습니다.

    • 각 장면은 프롬프트 템플릿과 권장 LORAs를 제공합니다. 템플릿을 덮어쓰거나 원하는 LORAs를 추가하세요.

    • 장면은 동일한 소스 이미지 또는 이전 장면의 마지막 프레임에서 생성할 수 있습니다.

    • 템플릿은 일반적으로 하나의 주체를 가정하지만, 대부분의 장면은 다수의 주체를 지원하므로 상상력을 발휘하세요.

    • 단일 클릭으로 모든 템플릿을 비활성화하고 메인 프롬프트로 Prompt Override 노드를 사용할 수 있습니다. Prompt Override는 장면 템플릿 프롬프트와 마찬가지로 플레이스홀더를 포함할 수 있으므로 장면 템플릿을 시작점으로 사용할 수 있습니다.

  • 설정 옵션 - 장면 선택, 영상 편집 및 최적화는 단일 클릭으로 조정 가능하며 모든 장면에 대해 완전히 세밀하게 조정할 수 있습니다.

    • Torch Compile 및 Sage Attention - 사용할 수 없는 경우 Torch Compile 노드를 우회하거나 비활성화하고 SDPA로 전환하세요.

    • Painter I2V(개선된 모션) 또는 기본 WAN 인코더를 단일 클릭으로 활성화.

    • LightX2V 모델을 단일 클릭으로 활성화: 낮은 노이즈에는 seko v1, 높은 노이즈에는 1022 또는 1030 중 선택.

    • GGUF 지원 - 로더에서 적절한 GGUF 모델을 선택하고 양자화를 비활성화하세요.

    • 사전 정의된 장면 LORAs - 장면 LORA 스택에 추가하거나 전용 사용자 정의 LORA 스택(녹색 노드)을 사용하세요.

    • 초상화/풍경, 업스케일링, 보간 및 프롬프트 오버라이드는 입력 이미지에 따라 자동으로 처리됩니다.

    • 키보드 단축키 - 1–5를 눌러 설정 옵션, 입력, LORAs 등으로 빠르게 이동.

  • 영상 편집 기능 및 도구

    • 2-in-1 I2V & FLF 워크플로우

    • Painter I2V 및 고 LORA 옵션을 사용한 개선된 모션(최적의 조합을 빠르게 찾아보세요)

    • 프레임 컷 - 시퀀스를 이어붙일 때 불필요한 전환 또는 중복 프레임 제거

    • TensorRT 업스케일 - 4배 업스케일. FlashVSR/SeedVR2보다 훨씬 우수함.

    • 리사이즈 - TensorRT 업스케일 후 독립적으로 lanczos로 업스케일하거나 다운스케일(예: 720p → 1080p 또는 720p → 5K → 1080p)

    • RIFE 보간 또는 빠른 TensorRT RIFE

    • 여러 출력 옵션: 원본 영상, 프레임 이미지 시퀀스, 다음 장면용 마지막 프레임, 프로덕션 후 버전

워크플로우 사용 방법

워크플로우의 기본 설정은 즉시 장면을 반복하여 진행할 수 있도록 구성되어 있습니다.

설정 옵션

팁: 1을 눌러 설정 옵션으로 빠르게 이동하세요

처리 옵션(첫 번째 섹션)

이 섹션에는 모든 포스트 프로세싱 설정이 포함되어 있으며, 여러 설정을 동시에 활성화할 수 있습니다.

  • 첫 번째 및 마지막 프레임 - 단일 시작 이미지 또는 이중 첫 번째 및 마지막 프레임 워크플로우를 전환합니다. 장면에 이미 두 개의 이미지가 있거나, 이전에 생성된 장면의 종료 프레임을 재사용하면서 시드를 변경하여 이야기는 다르게 전개되지만 원하는 방식으로 끝내고 싶을 때 유용합니다.

  • 프레임 건너뛰기 - 불필요한 컷이나 전환을 제거합니다. 예를 들어 미션어리 시나리오에서 주체가 앉아 있거나 누워 있는 상태에서 얼굴에 뿌리는 동작으로 전환할 수 있는데, 이러한 프레임을 건너뛰면 전환이 깔끔한 장면 컷으로 바뀝니다.

  • TensorRT 업스케일 - 여러 모델(Remacri, ClearReality, UltraSharp 등)을 지원하는 빠른 4배 업스케일입니다. 결과는 일반적으로 다른 업스케일링 방법보다 우수합니다. 이 노드는 HD, FHD, 2K, 4K, 2배 또는 3배로 다운스케일할 수도 있지만, 기본값인 “없음”을 유지하고 “0 4. 리사이즈”를 활성화하는 것이 좋습니다. 내장 노드 리사이즈는 바이큐빅을 사용하지만, 워크플로우의 리사이즈는 랜초스를 사용하며, 종종 눈에 띄는 향상이 있습니다. 또한 출력 치수에 더 큰 제어권을 가질 수 있습니다.

  • 리사이즈 - TensorRT 업스케일 후 또는 단독으로 적용할 수 있는 독립적인 랜초스 업스케일 또는 다운스케일입니다.

보간 옵션(두 번째 섹션)

한 번에 하나의 보간 방법만 활성화할 수 있습니다. 보간을 원하지 않는 경우 아무것도 선택하지 않으세요.

  • RIFE

  • TensorRT 최적화 RIFE(초고속)

참고: 현재 RIFE 노드는 정수 배수만 허용합니다. 향후 분수 배수 및 GIMM 보간을 지원하는 새로운 RIFE 노드를 탐색 중입니다.

출력 옵션(세 번째 섹션)

원본 출력은 프레임 건너뛰기, 업스케일링 및 보간 전에 생성됩니다.

처리된 출력은 모든 포스트 프로세싱 단계 이후에 생성됩니다.

각 옵션에 대해 다음을 할 수 있습니다:

  • 모든 프레임을 이미지로 저장.

  • 마지막 프레임만 저장(다음 장면의 시작 이미지로 유용).

  • 영상으로 내보내기.

포스트 프로세싱을 활성화하지 않았다면, 원본과 처리된 옵션을 모두 선택하면 중복 파일이 생성됩니다. 이 경우 처리된 버전만 유지하세요. 예를 들어 다른 앱에서 추가 업스케일링이 필요하거나 LLM/오디오 생성을 위해 해상도를 낮추려는 경우에만 원본 버전을 사용하세요.

I2V 인코더 선택(네 번째 섹션)

한 번에 하나의 인코더만 활성화할 수 있습니다.

  • Painter I2V - 모션을 개선하지만 구성이나 해부학적 아티팩트를 유발할 수 있는 새로운 인코더.

  • WanVideo I2V - 기본 인코더.

고 LORA 버전(다섯 번째 섹션)

한 번에 하나의 고 LightX2V LORA만 활성화할 수 있습니다.

  • 10/30, 강도 0.5 - 모션을 강화하지만, Painter I2V와 마찬가지로 구성과 해부학에 영향을 줄 수 있습니다.

  • 10/22, 강도 0.8 - 안정적인 기본 성능을 제공합니다.

기본 설정: 10/22 LORA + Painter I2V. 이 조합은 모든 시나리오에서 일반적으로 최고의 결과를 제공하지만, 일부 장면은 대체 조합이 더 나은 결과를 낼 수 있으므로 실험해보세요.

워크플로우 팁

처음으로 반복하며 좋은 시드를 찾을 때:

  • 처리, 보간 및 출력 옵션 중 Enable Processed Video와 선택적으로 Enable Processed Last Frame 출력만 활성화하세요.

  • 적절한 시드를 찾으면 고정하세요.

  • 포스트 프로세싱을 활성화하면 워크플로우는 포스트 프로세싱 단계와 출력만 실행하므로 상당한 시간을 절약할 수 있습니다.

시나리오 및 프롬프팅

팁: 2를 눌러 입력 노드로 빠르게 이동하세요

설정 옵션 옆에 사용 가능한 장면 목록이 있습니다. 한 번에 하나의 장면만 선택할 수 있습니다.

프롬프트 입력 동작

  • 장면이 선택되면 프롬프트 오버라이드가 장면 템플릿을 대체합니다.

  • 장면이 선택되지 않으면 프롬프트 오버라이드는 일반적인 긍정적 프롬프트로 작동합니다(플레이스홀더는 여전히 작동).

  • 부정적 프롬프트는 기본적으로 WAN 목록을 사용하며, 처리 섹션에서 조정 가능합니다.

각 장면은 다음을 포함합니다:

  • 프롬프트 템플릿 - 편집하거나 오버라이드할 수 있는 기본 템플릿.

  • 플레이스홀더 - 장면 간 공통 정보를 공유하는 데 사용.

지원되는 플레이스홀더:

  • : 예 “여성”

  • : 예 “아름답고 날씬한”

  • <subject_pronoun>: 예 “그녀”

  • <possessive_adjective>: 예 “그녀의”

  • : 예 “삐죽한 금발의 토끼머리, 파란 눈”

  • : 예 “넓은 모자, 흰 드레스” (일반적으로 첫 번째 프레임에 적용; 주체가 옷을 입은 채 또는 반쯤 벗은 상태로 유지하고 싶다면 오버라이드하세요)

  • : 예 “부푼 유두를 가진 크고 단단한 가슴”

  • : (책임감 있게 사용)

  • : 예 “해변에서” 또는 “거실 소파 위에” (활동에 적용되며 반드시 첫 번째 프레임에만 적용되는 것은 아님)

  • : 예 “서 있다”, “앉아 있다” (여기서도 활동을 의미하며 첫 번째 프레임을 의미하지는 않음)

참고: 대문자로 표기된 플레이스홀더(예: <Subject>)는 치환 시 값의 첫 글자를 자동으로 대문자로 변환합니다.

LORA 설정

팁: 3을 눌러 사용자 정의 LORA 스택으로 빠르게 이동하세요
  • 각 장면은 고 및 저 LORAs 세트를 정의합니다.

  • 장면 템플릿에 최대 5개의 세트를 직접 추가할 수 있으며, 장면 전환 중 워크플로우에서 사용할 추가 사용자 정의 LORA 스택(녹색으로 표시됨)을 사용할 수 있습니다.

  • 장면이 선택되지 않은 경우, 녹색 LORA 스택을 사용하여 자체 고/저 LORAs를 지정할 수 있습니다. 장면별 LORA는 자동으로 전환되며 간섭하지 않습니다.

핵심 입력 매개변수

짧은/긴 측면(영상 치수)

최고 품질을 위해:

  • 720 × 1280 -> 16 : 9 또는 9 : 16

  • 720 × 960 -> 4 : 3 또는 3 : 4

  • 방향은 업로드된 이미지의 종횡비에 따라 결정됩니다. 이미지가 선택한 치수와 다르면 해당 치수에 맞게 리사이즈되고 중앙에서 크롭됩니다.

  • 치수는 16으로 나누어 떨어져야 하며, 값은 자동으로 내림 반올림됩니다(예: 725 → 720).

업스케일 배수

입력된 배수 값을 기반으로 종횡비를 유지하면서 치수가 계산됩니다.

지속 시간 및 프레임 속도

기본값은 5초, 16fps입니다.

더 긴 영상은 생성에 더 많은 시간이 걸리며 메모리 부족 오류를 유발할 수 있습니다. WAN 모델은 일반적으로 5초 후 원본 이미지로 루프되며, 반복 동작에 유용할 수 있습니다. 10/22 LORA와 기본 WAN 인코더를 사용하는 경우 더 부드러운 모션을 위해 24fps를 사용할 수 있습니다.

프레임 건너뛰기

설정 옵션에서 활성화된 경우, 클립의 시작 및/또는 끝에서 제거할 프레임 수를 지정하세요.

스텝

8로 유지하세요. 모험심이 생기면 다른 값을 실험해보세요.

시프트

8–10이 적절합니다.

낮은 시프트 값(예: 5)은 이 유형의 영상에 일반적으로 나쁜 결과를 낳습니다.

추가 고려 사항

부정적 프롬프트

처리 섹션(빨간 노드)에서 조정 가능.

스케줄러

파란 노드를 조정하세요. 실제로 Euler(안정적)와 UniPC(창의적)가 가장 좋은 결과를 제공합니다.

플레이스홀더 추가

Placeholder Replace 하위 그래프를 수정하세요. 이는 “String Capitalize” 및 “Replace” 노드로 구성된 크고 간단한 스택입니다.

장면 추가

가능하지만 번거롭습니다. 각 장면은 그룹과 함께 복사할 수 있는 하위 그래프입니다(그룹은 Scenarios 스택에 나타나려면 특정 색상을 가져야 합니다). 문제는 이 장면 노드와 이미 크고 다소 멀리 떨어져 있는 프롬프트 및 LORA 스위치에 연결하는 것입니다.

향후 계획

  • 더 많은 장면 및 더 나은 템플릿 관리

    • 템플릿과 LORAs를 더 유연하게 관리하는 방법을 탐색 중입니다. Boyonodes를 고려했지만, 일부 장면에 필수적인 LORA 강도를 처리할 수 없었습니다. 프롬프트와 LORAs를 더 잘 관리할 수 있는 노드를 알고 계시면 알려주세요.
  • 추가 도구

    • 일부 옵션(예: LLM을 통한 자동 프롬프팅, 대규모 영상 연결)은 반복 및 클립 편집이 필요한 경우 모든 기능을 한 번에 처리하는 워크플로우가 종종 실패하기 때문에 의도적으로 제외되었습니다.

    • 향후 릴리스에서 예술적 필터, 색상 매칭, 오디오 생성(mmaudio/Ovi) 및 기타 도구를 통합할 계획입니다. 특정 요청이 있으시면 언제든지 알려주세요.

의존성

커스텀 노드

https://github.com/kijai/ComfyUI-WanVideoWrapper

https://github.com/rgthree/rgthree-comfy

https://github.com/kijai/ComfyUI-KJNodes

https://github.com/chflame163/ComfyUI_LayerStyle

https://github.com/Kosinkadink/ComfyUI-VideoHelperSuite

https://github.com/Fannovel16/ComfyUI-Frame-Interpolation

https://github.com/yuvraj108c/ComfyUI-Upscaler-Tensorrt

https://github.com/yuvraj108c/ComfyUI-Rife-Tensorrt

https://github.com/princepainter/ComfyUI-PainterI2VforKJ

TensorRT 노드 설치에 어려움이 있다면 다음 가이드를 사용하세요:

/model/2122077/rifetensorrt-interpolation-using-tensortcore-and-upscaler?modelVersionId=2402144

Triton 및 Sage Attention 설치에 어려움이 있다면 다음 가이드를 사용하세요:

https://github.com/Tavris1/ComfyUI-Easy-Install

모델

텍스트 인코더

https://huggingface.co/eddy1111111/Wan_toolkit/tree/main

WAN 2.2 고/저 모델

https://huggingface.co/Kijai/WanVideo_comfy_fp8_scaled/tree/main/I2V

LORAs

LightX2V 10/30

https://huggingface.co/Kijai/WanVideo_comfy/tree/main/LoRAs/Wan22_Lightx2v

LightX2V 10/22

https://huggingface.co/lightx2v/Wan2.2-Distill-Loras/tree/main

LightX2V Seko v1
https://huggingface.co/lightx2v/Wan2.2-Lightning/tree/main/Wan2.2-I2V-A14B-4steps-lora-rank64-Seko-V1

장면 LORAs

/model/1648982

/model/2048863

/model/2121111

/model/2007166

/model/1874811

/model/1986500

https://huggingface.co/JustAnotherCibrarian/base_wan22/tree/main/1879839?not-for-all-audiences=true

https://tensor.art/models/902621070467587542

/model/1811313?modelVersionId=2176505

/model/2048121

/model/2131565

/model/2118407

/model/1983608

/model/2031069

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.