WAN2.2-14B T2V-T2I Prehistoric <-> Futuristic slider
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
시간을 여행할 수 있는 텍스트 슬라이더.
알아야 할 사항:
저는 비디오 생성에 WAN을 사용하지 않았고, 오직 이미지 생성에만 사용했습니다. 참고로, 고노이즈 LoRA는 테스트하지 않았습니다. 저는 저노이즈 체크포인트와 일부 "터보" LoRA(*2)만 사용합니다(작동하는지 댓글로 알려주세요).
이것은 Ostris AI-Toolkit을 사용하여 "저사양" 하드웨어(*1)에서 제작되었습니다. 왜냐하면 모두가 불가능하다고 말하기 때문입니다 :)
75 스텝을 유지했습니다. 25스텝에서 300스텝까지 매 25스텝마다 테스트해본 결과, 가장 좋은 결과를 얻었기 때문입니다.
권장 최대 강도는 -7.5 / +7.5이며, 더 높게 테스트해볼 수 있습니다. 이는 다른 LoRA 및/또는 프롬프트에 따라 달라집니다.
높은 양수 강도에서는 인물들이 인형처럼 보일 수 있고, 높은 음수 강도에서는 키가 작아져 난쟁이처럼 보일 수 있습니다.
편집: 몇 가지 개념을 테스트하는 이미지를 추가했습니다. 그러나 일부 이미지에는 만족하지 못했습니다(특히 차량, 풍경, 기타 등). v2를 개발 중입니다.
댓글 환영합니다.
(*1): 32GB RAM과 8GB VRAM을 가진 모바일 RTX4060을 탑재한 노트북에서 학습했습니다.
(*2) 참고: T2I 생성 시 저는 다음 LoRA 조합을 사용합니다(모든 예시 이미지는 이 조합으로 생성되었습니다):
이 LoRA는 WAN2.1용이지만, 제 테스트 당시(어느 시점에) 더 나은 성능을 발휘하는 것을 확인했습니다.












