LTX Penis Lora (Alpha)
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
트리거는 PENISLORA입니다.
43개의 동영상과 84개의 이미지( Wan에서 가져옴)를 사용하여 학습되었습니다.
캡션은 WAN과 정확히 동일합니다.
현재 LTX 트레이너는 이미지 + 동영상 학습을 지원하지 않기 때문에, 동영상으로 4.4k 스텝 학습한 후 체크포인트에서 재개하여 추가로 7.5k 스텝(총 11.9k 스텝)을 학습했습니다.
이 LTX-2 트레이너 도구를 RunPod의 RTX 6000 ADA에서 사용하여 학습했습니다
이것을 "알파"라고 부르는 이유는 매우 불안정하기 때문입니다.
- 떨림 동작과 상호작용 없이 음경을 잘 생성할 수 있습니다.
- 적절한 프롬프트 스타일을 사용하면 오라리 성행위를 할 수 있지만, 종종 음경이 분리되어 나타납니다. 블로워를 음경 근처에 배치하거나 이미 행동 중인 상태로 프롬프트해야 합니다.
- 사정은 WAN과 같은 문제를 겪으며, 입에서 사정이 발생합니다. 하지만 제공된 예시 동영상에서 일부 양호한 결과를 확인할 수 있습니다.
- 벌거벗은 가슴을 생성할 수 있으며, 그 결과가 꽤 마음에 듭니다. 이는 유방 + 음경 LoRA를 하나로 통합한 것입니다.
- 데이터셋에는 항문/음부 삽입 데이터가 없습니다.
- 음경은 앞쪽/측면 보기만 존재합니다. POV/뒷쪽 보기에는 작동하지 않습니다.
- 음경 머리의 형태가 좋지 않으며, 특히 어떤 물체와 상호작용할 때 더 그렇습니다. 음경 머리를 잡거나 빨지 않으면 형태는 괜찮습니다.
이것이 어느 정도 작동하기 때문에 공개하려 했지만, 향후 많은 업데이트를 할 예정입니다. 아마도 동영상 데이터를 모두 버리고 처음부터 다시 시작할지도 모릅니다. 이 데이터셋은 원래 LTX용으로 설계된 것이 아니라 Wan용으로 최적화된 것이기 때문에 여러 문제가 있습니다. 개선을 위해 건설적인 피드백을 매우 환영합니다.
이것은 제 세 번째 시도입니다. 처음에는 Abliterated GEMMA 인코더로 학습했지만 결과가 매우 나빴습니다. 일반적인 GEMMA 3은 문제 없이 작동하며, 이 모델은 이를 사용했습니다. 제가 사용한 워크플로를 첨부하니 원하신다면 같은 방식으로 시도해 보세요. 명확성을 위해 가능한 한 예시 워크플로에 가깝게 구성했습니다. i2v 및 t2v 예시용 zip 파일은 데이터셋 다운로드에서 확인하세요.
