Yet Another Workflow: easy t2v + i2v (Wan 2.2)

세부 정보

모델 설명

또 하나의 워크플로우: 간단한 t2v + i2v

저는 ComfyUI를 위한 사용자 친화적인 UI를 목표로 했습니다. 복잡성과 사용 편의성 사이의 균형을 유지하면서, 이 워크플로우는 무엇에 신경 써야 할지 명확한 안내를 제공하는 유용한 제어 기능을 제공합니다. ComfyUI의 품질과 일반적인 UI 문제로 고생하는 분들에게 이 워크플로우가 도움이 되길 바랍니다. 색상으로 구분하고 많은 설명을 추가했습니다. 설명을 꼭 읽어주세요! 유용하게 만들려고 노력했습니다!

이것은 제가 실제 사용하는 워크플로우이며, 특정 기술 수준을 목표로 하지 않습니다. 몇 가지 UI 상의 양보와 라벨링을 통해 초보자도 쉽게 조정하고 사용할 수 있도록 설계되었습니다. 공식 예제 워크플로우보다 더 정교한 방식으로 작동하며, 쉽게 깨지지 않습니다.

이 워크플로우의 주된 목표는 텍스트에서 영상(T2V) 또는 이미지에서 영상(I2V)으로 출력을 생성할 때 별다른 번거로움 없이 강력한 기초를 제공하는 것입니다. Lightx2\\ning은 기본적으로 켜져 있습니다. (이것은 다양성을 희생하여 생성 속도를 높이는 가속기입니다.)

녹색 제어 항목은 일반적으로 수정하고 싶은 부분입니다.

보조 목표는 다양한 샘플러와 일관된 방식으로 상호작용할 수 있는 인터페이스를 제공하는 것입니다.

버전

주요 워크플로우는 기본적인 ksampler 노드를 지원하며, 경험을 쌓고 실험하고 싶을 때 Clownshark 샘플러를 활성화할 수 있는 토글 기능도 포함합니다.

버전 v0.3에서는 추가적인 정리와 사소한 개선 외에, TripleKSampler를 도입했습니다. 이는 새로운 노드를 통해 3개의 샘플러를 활용한 고급 기술을 가능하게 하며, 가속 LoRA 없이 초기 노이즈 패턴을 생성하여 Vanilla Wan의 역학을 더 잘 유지하는 영상을 만들어냅니다(단, 시간은 약 15-30% 더 소요됩니다).

추가 버전들은 지속적으로 업데이트할 예정입니다.

Comfy와 Wan에 매우 초보라면? MoE 버전을 사용해보세요. 이 버전은 몇 개의 노드를 제거하면서도 거의 동일한 인터페이스를 제공하며, 시각적 복잡성을 줄여 익숙해지기 쉽게 도와줍니다. 이 버전에 익숙해지면, 더 많은 기능을 위해 주요 버전으로 올라가세요.

더 나은 프롬프트 준수를 원하시나요? 저는 WanVideo 노드를 지원하는 워크플로우 버전을 만들었습니다. 표준 버전에 익숙해지기 전에는 이 버전을 사용하지 않는 것이 좋습니다. 시각적 복잡성이 증가합니다. 이 노드는 다른 시스템과 완전히 다르게 작동하며, 동일한 인터페이스를 제공함으로써 더 쉽게 접근할 수 있도록 설계했습니다. WanVideo는 일반적으로 전혀 다른 결과를 생성하므로, 탐구해볼 만한 흥미로운 선택지가 될 수 있습니다.

좋아하셨나요?

사용할 때 자원으로 표시해주세요! 좋아요를 눌러주세요! 진심으로 홍보를 필요로 하진 않지만, RunPod 크레딧 코드를 보내주시면 감사히 받겠습니다!

도움이 필요하신가요?

이 분야에 대해 사람들이 시작하도록 돕는 것을 좋아합니다. 도움이 필요하시면 저에게 메시지를 보내세요. 세부사항을 안내하고, 질문에 답하며, 추가 팁과 트릭, 스크립트를 제공해 드리겠습니다. 몇 분들에게 이미 이런 도움을 드렸고, 시간과 고생을 줄여드릴 수 있습니다. (이 서비스를 이용해 주신다면 RunPod 크레딧 코드를 보내주시면 감사하겠습니다.)

또한, 여기에 기사를 작성했습니다. 이 기사에는 설정 시간을 단축하는 쉘 스크립트가 포함되어 있습니다. v0.3 출시와 함께 기사에는 더 빠르고 최신 설정 스크립트가 업데이트되었습니다.

일반적인 조언

  • 많은 영상을 만들고, 영상을 올리세요! 기술에 너무 신경 쓰지 마세요! 이 도구를 사용할 때 시간을 현명하게 사용하세요. 원하는 영상을 만드는 것보다 기술적인 문제 해결에 더 많은 시간을 쏟으면 금방 지칠 수 있습니다. 제가 이 워크플로우를 공유하는 진정한 이유입니다.

  • RunPod를 사용하세요. L40S를 사용하세요. Hearmeman의 Wan 2.2 템플릿을 사용하세요. RunPod를 처음 사용하신다면, 제 링크로 가입해주세요. 둘 다 무료 크레딧을 받을 수 있습니다.

  • 일부 맞춤 노드를 설치해야 합니다. Comfy 인터페이스 상단의 "Manager" 버튼을 클릭한 후, _"Install Missing Custom Nodes"_를 클릭하세요. 각 노드에 대해 _"Install"_을 클릭해주세요. 순서대로 설치하는 것을 추천하며, 각 노드 설치가 완료될 때까지 기다려야 합니다. 모든 노드가 설치될 때까지 ComfyUI를 재시작하지 마세요.

  • 연결선이 불편하다면, 플로팅 UI 오른쪽 하단에 있는 버튼을 눌러 연결선을 숨길 수 있습니다.

  • Lightx2\\ning이란 무엇인가요? 이는 Lightx2와 Lightning(즉, Wan 2.2 버전)을 통칭하는 제 짧은 표현입니다.

  • 필요시 Lightx2\\ning을 끄는 것도 쉽게 할 수 있지만, 속도가 훨씬 느려진다는 점을 기억하세요!

  • 이 워크플로우는 .safetensors 모델을 기준으로 구성되어 있지만, 원하시면 GGUF를 사용하여 조정할 수 있습니다.

  • UI에 Clownshark 샘플러가 방해가 된다면, 그 그룹을 삭제해도 부정적인 영향이 없습니다. (샘플러 선택을 위한 보라색 mute 노드도 삭제할 수 있습니다.)

비용은요?

궁금하실 수 있어, 예시 영상(720x1280)은 약 6.5분이 소요됩니다. (저는 보통 실험할 때 이 해상도를 사용하지 않습니다.) 일반적으로 23분 내로 좋은 품질의 영상을 만들 수 있습니다. 일반적으로 시간당 약 $0.90의 비용으로 운영하고 있으며, 이때 시간당 약 920개의 고품질 영상을 생성할 수 있어, 영상당 약 $0.045$0.10(반올림)의 비용이 발생합니다(L40S 기준). (Pod 로딩을 위한 세션 시작 비용이 약 1센트 정도 추가됩니다.) 제게 이상적인 생성 시간은 12분이며, 위의 시간은 그보다 약간 길지만, 비용 측면에서는 합리적입니다. 더 빠른 GPU를 사용하면 더 빠르게 만들 수 있지만, 현재 기술 수준에서는 이 균형이 저에게 가장 적절합니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.