Consistent Face (Wan Video 14B t2v)
세부 정보
파일 다운로드
모델 설명
일관된 얼굴 (Wan Video 14B t2v)
T2V 또는 I2V에서 일관된 얼굴을 보장하기 위해 3D 영상으로 학습됨
약 20번의 실행에서 얼굴이 일관되었으나, 이는 모든 생성에서 100% 일관성이 보장된다는 의미는 아니다. 이러한 실행의 비용이 10k buzz였음을 고려하여, 다음 질문을 올리기 전에 아래 내용을 읽어보길 바란다: "이 LoRA는 무엇을 하나요?"
나는 내가 학습하는 어떤 Wan LoRA의 전체 효과도 예측할 수 없다는 것을 더 어떻게 명확히 설명할 수 있을지 모르겠다. 최선의 경우 몇 개의 에포크 이미지만 얻고, 최악의 경우 아예 정보를 얻지 못하기 때문이다.
내 로컬 학습에서는 기울기와 손실을 모니터링할 수 있고, 90/10 또는 80/20을 평가할 수 있으며, 수천 장의 이미지를 생성하여 테스트할 수 있다. 하지만 현재 14B에서는 그런 여유가 전혀 없다.
