Asshole - Wan 2.2 T2V/I2V 14B
세부 정보
파일 다운로드
모델 설명
매우 큰 컬렉션과 다양한 개념에 대해 학습되었으며, 주요 개념은 등에 누워 항문을 드러내는 여성들입니다. 편향을 방지하기 위해 정규화 데이터도 혼합되었습니다.
이 모델은 다양한 장면에서 잘 작동하며, 의도한 작업보다 훨씬 더 많은 작업에 유용할 잠재력을 보입니다.
T2V 및 I2V 모두에서 작동합니다.
학습/데이터셋 파라미터
- 3초 길이의 259개의 512x512 비디오.
- 189개의 1024x1024 이미지.
- 랭크 128.
- 고노이즈 상태에서 18 에포크.
- 저노이즈 상태에서 22 에포크.
- 데이터가 적은 개념에 대해 더 높은 반복 수 사용.
- 학습률은 처음에 둘 다 0.0001로 시작하였고, 마지막 약 20%의 학습은 약 0.00002로 진행됨.
- 비디오는 내가 개발한 맞춤 도구를 사용해 자르고 크롭함.
- 캡셔닝:
- 초기 캡셔닝에는 Qwen2.5-VL 사용.
- 각 다른 개념에 맞춰 시스템 프롬프트를 조정하여 모델이 무엇을 주의 깊게 볼지 맥락과 지침 제공.
- 수동으로 검토하고 소규모 수정 수행.
- 단일 5090 GPU에서 diffusion-pipe를 사용해 학습.
학습된 내용:
- 풀다이버 위치의 여성
- 손으로 엉덩이를 벌리는 모습
- 시청자가 엉덩이를 벌리는 모습
- 음순 아래쪽에서의 클로즈업
- 남성의 항문 삽입
- 남성의 항문 추출
- 남성의 항문 스러스팅
- 측면 시점
- 1인칭 시점
- 음모의 다양한 밀도(그러나 여전히 이를 제어하지 못함)
- 사정(제어가 어려움)
- 캐릭터 누출을 최소화하기 위해 얼굴은 대부분 프레임 밖으로 잘림
할 수 없는 것:
- 서 있는 자세에 좋은 결과를 기대하지 마십시오. 데이터셋에 그런 사례가 없습니다.
샘플과 연결된 프롬프트를 참조하세요.