WAN 2.2 I2V - Edible Anuses
세부 정보
파일 다운로드
모델 설명
이것은 비교적 간단한 저노이즈 전용 항문 LoRA입니다. 목표는 시작 이미지에 항문이 보이지 않을 때, 적절한 위치에 현실적으로 보이는 항문을 생성하는 것이며, 과도하게 벌어지거나 손상되지 않도록 하는 것이었습니다. 특히 이 LoRA는 제 POV 얼굴 앉기 LoRA와 함께 사용되도록 설계되었습니다.
이 LoRA가 작동하려면 프롬프트에 단순히 "anus"라는 단어가 어디에든 포함되어야 합니다. 그러나 WAN은 종종 항문을 어디에 놓아야 할지 전혀 모르기 때문에 다음 문장이 매우 도움이 됩니다:
여성이 자신의 항문을 보여준다. 그녀의 항문은 외음부 바로 위에 있다.
물론 대상이 등쪽으로 누워 있다면, 항문을 외음부 아래에 있다고 설명해야 합니다. LoRA는 항문의 모양에 대한 구체적인 정보를 추가할 수 있습니다. 예:
작고 둥근 항문
항문은 분홍색을 띤다
그녀의 항문은 중심에 있으며 약간 주름져 있다
이 LoRA의 학습 자료에는 종종 항문과 외음부가 함께 포함되어 있었기 때문에, 외음부의 형태와 색상을 조절하는 데에도 사용할 수 있습니다. 그러나 이 부분은 충분히 테스트하지 않았습니다. 프롬프트에서 핵심 키워드는 "vulva"와 "labia"입니다.
테스트
저는 베이스 WAN 2.2 I2V Q8과 lightning LoRA만 사용하여 이 LoRA를 테스트했습니다. 혼합된 다른 요소는 없었기 때문에 WAN이 원래 알고 있던 것과 LoRA가 도입한 것이 명확히 구분되었습니다. 아래는 최종 프레임의 비교 사례입니다. 왼쪽은 LoRA 없음, 오른쪽은 LoRA 사용(가중치 1~1.5 범위).
LoRA 없음:

LoRA 가중치 1.0:

LoRA 가중치 1.5:

LoRA 가중치 2.0:

명확히 보이듯, 최종적으로 실제 항문이 나타나기 시작합니다. 이 영상의 시작 프레임은 다음과 같습니다:

그러나 저는 이 LoRA가 더 많은 학습을 필요로 한다고 생각합니다. 그래도 제 기준으로는 나쁘지 않은 시작입니다.
데이터셋 및 학습 정보
입력 데이터셋은 모두 Reddit에서 직접 가져온 167개의 동영상입니다(서브레딧 이름은 추측하실 수 있을 것입니다). 배치는 처음 3초만 자르고 16fps로 제한했습니다.
데이터셋은 JoyCaption Beta와 DarkAges 70b를 사용하여 자동으로 캡션화되었습니다.
학습은 512 해상도에서 30 에포크, 1회 반복, 배치 크기 2로 diffusion pipe를 사용하여 진행되었습니다. 학습률은 2e-4입니다.
언제나 그렇듯, 아직 제가 무엇을 하고 있는지 확신이 서지 않으며, 피드백을 환영합니다!
