Wan2.2 Yoshiaki Kawajiri retro anime style t2v
세부 정보
파일 다운로드
모델 설명
요시아키 카와지리는 80년대와 90년대 마도우스 스튜디오의 프로듀서, 감독, 캐릭터 디자이너였습니다. 그는 《위커드 시티》, 《닌자 스크롤》, 《뱀파이어 헌터 D: 블러드러스트》의 감독으로 가장 잘 알려져 있습니다. 이 스타일은 그의 초기 작품을 바탕으로 합니다.
여기서 사용된 영상은 wan2.2를 사용하여 고잡음과 저잡음으로 생성되었습니다. 또한 v2 및 v1용 샘플을 생성할 때 lightx2v wan2.1 t2v LoRA를 사용했습니다. v3는 기본 모델만 사용합니다(속도 향상을 위해 여전히 디스틸 LoRA를 사용하는 것을 추천합니다). 저잡음 및 고잡음 LoRA의 강도를 1로 설정할 수 있으며, 필요에 따라 더 높게 조정할 수 있습니다.
다음 조건으로 생성된 샘플:
샘플러: lcm
스케줄러: beta
추가 LoRA: wan2.1 t2v lightx2v
고잡음: 4단계
저잡음: 4단계
저잡음 LoRA는 LR 3e-5로 6000 Pro Blackwell에서 약 36시간 학습되었습니다.
고잡음 LoRA는 LR 4e-5로 약 8시간 학습되었습니다. 기술적으로 고잡음은 에포크 32까지 학습했지만, 과도하게 학습된 것으로 나타났고, 에포크 16이 가장 좋은 결과를 제공했습니다.
버전 3 업데이트: 추가로 32 에포크 학습하고, 데이터셋에 더 많은 짧은 클립을 포함하도록 조정했습니다. 대부분의 예시는 Lightning/FusionX/Lightx2v 없이 렌더링하여 기본 모델의 능력을 보여줍니다. 불확실할 경우, 기본 모델 렌더링을 위한 단계 수를 20으로 설정했습니다.
