V3 Final! DeJanked Speed Hack Hunyuan T2V Final Boss

세부 정보

파일 다운로드

모델 설명

대규모 개선. 진정한 리파이너 속도 해킹.

DeJanked 속도 해킹 Hunyuan T2V 최종 보스:
AI 영상 워크플로우가 할머니가 프로그래머를 하는 것보다 더 천천히 움직이는 것에 지치셨나요? 놀라운 품질을 포기하지 않고도 빠른 속도를 원하시나요? 안전벨트를 매세요. 이건 단순한 워크플로우가 아니라 Hunyuan T2V 최적화의 최종 보스입니다. 위약 효과 해킹, 정신건강 테스트, 체인형 마법을 거친 화염의 시험을 통해 이 설정은 렌더링 시간을 획기적으로 단축하고, GPU가 숨을 쉴 수 있게 하며, 여전히 현실을 의심하게 만드는 e-girl급 프레임을 생성합니다. 도전해볼 용기 있나요? 빠르고 매끄럽고, 아마도 당신의 정신을 뒤흔들 수 있습니다(하지만 GPU는 안전합니다).

TL/DR:
표준: 180초 (우수한 품질)
속도 해킹 후: 100초 (우수한 품질)

다운스케일링/업스케일링 없음
Wavespeed 없음, TeaCache 최소화

XL 유사 효과는 없음(기만당한 기분입니다. 아래 테스트 참조)

이건 다른 차원의 것입니다(결과를 공유해주세요)

테스트:

Wavespeed: Triton에 의존하므로, 많은 사용자들이 Windows에서 설치에 어려움을 겪기 때문에 테스트하지 않습니다(Windows 설치에 여러 가지 문제를 일으킬 수 있음... WSL을 사용하고 Wavespeed를 쓰는 사용자들은 스스로 Wavespeed를 적용하는 방법을 찾을 수 있을 것입니다. 이 설정은 가능한 한 많은 사용자에게 최대한의 접근성을 제공하기 위함입니다.

사용 하드웨어: 3090 TI 24GB VRAM, 64GB RAM, WSL

100프레임, 10스텝, 3스텝 리파이너, 512x512 (업/다운스케일링 없음) 기준

목표:

- 품질을 잃지 않고 속도를 극대화
- 업스케일링 및 다운스케일링 사용하지 않음
- 트릭 없이, 표준 노드만으로 최대 성능 발휘

방법: 각 단계마다 3번 생성

바닐라 기준:

라운드 1: (기본 비디오 생성, 아무 트윅 없음, 단순 생성 + 리파인)

흐름: 일반 (특이한 이상 움직임 없음)
품질: 높음
180초
통과

라운드 2:
메인 및 리파이너 모두 Teacache 샘플러를 1.6(빠름)로 설정

흐름: 일반
품질: 높음
172-175초
통과

라운드 3:
메인 샘플러: Teacache 4.4(형태 없음), 리파이너: 일반

품질: 평균~낮음, 리파인은 더 나았지만 품질 손실, 4스텝으로 올려도 마찬가지

흐름: 일반, 약간의 이상 현상(과장된 일반적인 이상 현상 가능성)

154초
실패

라운드 4:
TeaCache 샘플러 빠름 설정 + TeaCache Thresh 노드 0.15 도입

품질: 좋음
흐름: 좋음
180초 (???)

실패(샘플러와 충돌할 가능성이 있어 무의미함)

결과: 메인과 리파이너 모두 빠른 샘플러 설정이 가장 균형 잡힌 해법으로 보임. 더 빠른 설정 여부는 추가 테스트 필요, 하지만 몇 초 차이는 원하는 성능 향상이 아니므로 이 정도로 마무리 (몇 초 더 빠르거나 느려지는 것은 목표 아님)

이제 XL 해킹을 단 한 번이라도 확실히 테스트해 봅시다.

XL 해킹:
사라짐, 위약 효과, 약화됨! 평균 185초. 제거하고 불에 던져버렸습니다(... 기만당했다고 느꼈습니다!)

다음: Daisy Chain 리파이너 속도 해킹

결과:

1개 메인, 2개 리파이너 스텝 (인코딩/디코딩 없음):

100프레임, 9스텝
품질: 높음
흐름: 좋음

100.34초

필요에 따라 시작 스텝을 조정하면 품질을 조절할 수 있으며, 5,2,2 설정이 탁월한 결과를 생성합니다. 여기서 시작하는 것을 권장합니다.

왜 이게 작동할까요?

저는 모르겠지만, 첫 번째 스텝이 형태를 만들고, 두 번째가 내용을 채우며, 세 번째가 정교하게 만든다고 가정합니다. 각 스텝이 이전 결과를 기반으로 하며, 오버헤드를 줄이고 처음부터 다시 시작할 필요 없이 점진적으로 발전시킨다는 의미입니다. 혹은 시뮬레이션 유니버스와 피키 덧붙임... 분명히 그렇습니다.

여기서 끝입니다. 가능하면 결함을 찾아보세요.

시도해보세요. 무료이며, 저에게는 불처럼 빠릅니다.

일부 렌더링에서 약간 빠르게 움직이는 이상 현상이 발생합니다(동일 시드로 재렌더링 후 FPS를 약간 낮춰보세요).

이후에는 이걸 더 개선할 수 있는지 확인해보세요... 하지만 실행하기 전, 자신의 일반적인(비정상적인) 워크플로우를 Wavespeed 없이 최소 3번 실행해보세요(캐시가 뜨거워질 시간을 주기 위함입니다. 세 번째 실행 시 최적 속도에 도달합니다).

저는 Hunyuan 8b 720 (빠름) 모델을 사용했고, 활성화된 LoRA는 단 하나뿐이었으며, CivitAI에서 발견한 fastvideo LoRA를 -0.30으로 적용했습니다(대형 모델엔 양수, 빠른 모델엔 음수). 주 영상 모델에 e-girl LoRA를 재미로 추가했으나 테스트의 일부는 아닙니다.

경고: 어떤 것도 다운스케일링하지 않았습니다. GPU 모니터링을 하세요. 최소한 처음엔 512x512로 시작해서 점차 확장(또는 축소)하세요. 이 설정은 렌더링 시간을 단축하지만 GPU 오버헤드를 낮추지 않습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.