Wan Self Forcing Rank 16 (Accelerator)
세부 정보
파일 다운로드
모델 설명
공지 사용하는 도구에 맞는 올바른 버전을 다운로드하세요😉 공지
Wan Self 강제 랭크 16
이와 유사한 다른 버전들이 업로드되었지만, 이들은 다른 LoRA와의 호환성이 낮고 내부 구조 때문에 Blissful Tuner(제가 개발한 고급 확장된 Musubi Tuner: https://github.com/Sarania/blissful-tuner/)와 함께 사용할 수 없었습니다. 이 버전은 https://huggingface.co/lightx2v/Wan2.1-T2V-14B-StepDistill-CfgDistill에서 추출한 랭크 16 버전으로, 호환되는 샘플러와 함께 사용하여 Wan 아키텍처 모델로 4~8단계 고화질 디퓨전을 가능하게 합니다. Blissful 호환 버전과 Comfy 호환 버전 모두 제공됩니다. 이 버전들은 다른 LoRA와의 호환성을 향상시키기 위해 필요한 최소한의 파라미터만 타겟으로 합니다.
사용 방법:
LCM과 같은 호환 샘플러를 사용해야 하며, flow_shift = 8.0, guidance_scale/CFG = 1.0이어야 합니다. 즉, 음성 프롬프트를 사용할 수 없습니다(참고: 아래 댓글에서 더 나은 화질과 음성 프롬프트를 얻는 방법을 확인하세요). 하지만 이로 인해 어떤 Wan 아키텍처 모델을 사용하든 뛰어난 화질과 빠른 비디오 디퓨전이 가능합니다. 저는 직접 T2V, I2V, Skyreels V2 모두에서 시도해보았고, 모두 완벽히 작동했습니다! 또한 제가 시도한 기타 LoRA와도 잘 작동합니다. 여기에 있는 키스 시연 영상은 제 AmorousLesbianKisses 모델로, 네 바퀴 차량 영상은 /model/1698719/high-speed-dynamic?modelVersionId=1922492로 제작했습니다. CFG/음성 프롬프트가 없기 때문에 프롬프트 가중치를 사용하시면 좋습니다. 또한, 정말 음성 프롬프트가 필요하다면 첫 번째 스텝에만 낮은 값(예: 1.6)으로 CFG를 적용해보세요.
T2V에는 6단계, I2V에는 4단계를 사용하는 것을 선호합니다. 시연 영상(832x1104@81f)은 제 4070 Ti Super에서 약 5분 안에 생성되었고, 이후 몇 분 더 걸어 16fps를 32fps로 VFI 처리했습니다. 참고로, 저는 이 디스틸된 모델을 학습하지 않았으며, 이 작업의 공로는 lightx2v에게 있습니다. 그분들이 이 모델을 관대한 조건으로 공개해 주셔서 감사합니다. 저는 품질 기준에 부합하는 디스틸된 Wan 모델을 기다려왔고, 이 모델이 바로 그 답이었습니다. 제 생각엔 CausVid/AccVid 같은 다른 모델보다 우수합니다. 위에서도 언급했듯, T2V뿐 아니라 I2V 및 Skyreels V2까지 모두 성공적으로 사용했습니다. 따라서 대부분의 Wan 파생 모델과 호환될 가능성이 높습니다.
앞서 언급했듯이, 이와 유사한 버전들이 이미 업로드되었습니다. 하지만 위에서 언급한 호환성 문제 때문에, 그리고 저의 추출 버전이 더 작고 다른 LoRA와의 호환성을 위해 더 정교하게 설계되어 있기 때문에 다시 게시하는 것이 가치 있다고 판단했습니다.
P.S. Wan 또는 다른 디퓨전 모델에서 직접 LoRA를 추출하고 싶다면, 제가 사용한 스크립트는 Blissful Tuner의 여러 부가 기능 중 하나입니다: https://github.com/Sarania/blissful-tuner/blob/main/src/blissful_tuner/extract_lora.py
