업데이트 메모:
이 업데이트는 Runpod의 H100S GPU에서 약 20시간의 학습을 거쳤으며 약 50달러의 비용이 들었습니다. 피드백과 홍보를 정말로 감사드립니다 :) 저는 학습과 열정을 위해 이 작업을 하고 있으며, 학습이 후퇴하지 않는 한, 이 모델을 Wan t2v 14b에서 음경의 정면 이미지를 제공하는 일괄 솔루션으로 만들기로 결정했습니다. (충분한 자금이 있어 Runpod을 계속 사용하거나, 제 3090에서 로컬로 학습할 수 있다면요...) 이번 버전은 이전 v.05와 비교해 훨씬 큰 향상이 있으며 추가된 데이터는 매우 적습니다. 시도해보시면 놀라실 겁니다. 하지만 여전히 베타이며 완벽하지는 않습니다...
아래 업데이트 노트에서 새로 추가된 내용을 확인하세요.
이 LoRA는 Wan 2.1 14B t2v 모델에 학습되었으며, 여성에게 평균에서 큰 음경의 정면 시점 이미지를 제공하도록 설계되었습니다. (남성에 대한 생성은 수행하지 않았습니다.)
중요 정보:
트리거 단어: PENISLORA (프롬프트 앞에 그대로 붙이세요)
최적 강도: 0.7–0.85 (강도가 높을수록 다양성 감소, 낮을수록 음경이 덜 나옵니다). 저는 0.85를 선호합니다.
버전 업데이트 v0.6 노트:
추가한 데이터에는 오일링, 음경 자극, 그리고 여러 각도의 영상/사진이 포함되어 있습니다.
이는 v0.5의 3.3k 스텝 / 42 에포크에 추가로 6K 스텝 / 60 에포크를 더한 것입니다.
이제 대부분의 각도에서 음경의 정면을 명확하게 보여줄 수 있습니다(이상한 끝부분은 줄었지만 여전히 완벽하지는 않습니다).
1개의 POV 오일링 콘텐츠가 포함되어 있으나 여전히 충분하지 않아, 진정한 POV는 아직 구현되지 않습니다. 측면 또는 정면에서는 가능합니다.
이제 음경을 손으로 잡거나 입에 넣는 장면에서 특히 뛰어납니다.
딥스로트도 가능하며, 머리 부분은 “음경 끝부분”, 바닥 부분은 “음경 뿌리”라고 명시해 주세요.
여전히 몇 가지 문제점이 있습니다. 손의 윗부분과 음경 끝 사이에 공간이 충분히 생기지 않으면, 음경이 구부러지거나 늘어나는 현상이 발생할 수 있습니다.
v0.6 학습 기술적 노트:
Epoch 42의 LoRA 가중치를 init_from_existing로 로드했습니다. 다음에는 체크포인트에서 재개할 예정입니다만, 데이터는 괜찮았습니다.
글로벌 스텝 카운트를 0으로 초기화하고, 이전 지식을 계승해 새로운 학습을 시작했습니다.
데이터셋에 8개의 새로운 캡션 영상 + 8개의 이미지를 추가했습니다(해상도 동일).
연속성과 강화를 위해 이전 데이터셋 항목은 유지했습니다.
전체 Deepspeed 체크포인트(global_step)에서 재개하지 않고, LoRA 상태만 사용했습니다.
로드된 LoRA 기반으로 학습을 계속해도 데이터 오염이 없으며, 행동 확장에 안전하고 손실도 여전히 좋은 범위입니다.
워크플로우:
워크플로우 .json 파일도 함께 제공하여 사용한 노드 및 설정을 확인하실 수 있습니다. 기본적으로는 Kijai의 표준 Wan 14B t2v fp8 모델을 3090에 최적화한 버전입니다(tea-cache, slg, torch, sageattn, CFG star zero 등). 가능한 한 많은 프레임을 생성하기 위해 프레임 수는 65로 설정하고, Wan 기본 해상도 832x480을 사용하며, 인터폴레이션 프레임/업스케일을 적용하면 약 4초 클립당 10분 정도 소요됩니다.
샘플 프롬프트:
고품질 영상: 부드럽게 조명된 침실에서 나무 의자에 편안히 앉아 있는 탈의한 여자. PENISLORA는 완전히 발기되어 배에 기대어 있고, 한 손으로 부드럽게 쓰다듬고 있다. 카메라는 그녀의 가슴 높이에서 정면으로 고정되어 있으며, 약간 의자에서 몸을 움직이는 미세한 신체 움직임이 보인다. 따뜻하고 친밀한 분위기, 리얼리즘 스타일.
고품질 영상: 큰 자연스러운 가슴을 가진 아름다운 일본 여성. 부드러운 흰색 시트 위에 등으로 누워 있다. 피부는 하얗고, 귀 길이의 단발에 히메 스타일 컷, 곧은 앞머리와 볼 길이의 옆머리. 검은색과 흰색 메이드 복장의 상의는 버튼을 풀어 열어, 가슴을 완전히 드러냈다. 그녀의 발기된 PENISLORA 음경은 허리뼈 아래, 허벅지 사이에 자연스럽게 부착되어 있다. 그녀는 따뜻하게 미소 지으며 카메라를 직접 바라본다. 한 손으로 음경의 줄기를 단단히 감싸 천천히 위아래로 쓰다듬는다. 그녀의 고환은 부드럽게 침대 위에 놓여 있다. 카메라는 그녀의 정면 위쪽에 위치해, 머리부터 골반까지 전신을 포착하며, 얼굴 전체가 명확하게 보인다.
고품질 영상: 공공 버스의 승객 시점. 대면하는 의자에 앉아 있는 아름다운 싱가포르 여성. 밀착된 흰색 니트 터틀넥 스웨터를 입고 있으며, 젖꼭지의 희미한 윤곽이 원단을 통해 드러난다. 짧은 접힌 치마가 허벅지 위에 있으며, 다리는 약간 벌어져 있다. 버스가 도로의 작은 진동을 타며 움직일 때, 그녀는 다리를 더 벌리며 발기된 PENISLORA 음경을 드러낸다. 음경은 자연스럽게 허벅지 사이에 부착되어 버스의 움직임에 따라 살짝 흔들린다. 줄기는 붉고 단단하며, 치마의 올라간 원단 아래 끝부분이 완전히 노출되어 있다. 그녀는 시선을 직접 맞추며 강렬하게 미소 짓고, 표정은 장난스럽고 집중되어 있다. 주변 승객들은 앞으로 바라보거나 창밖을 바라보며 이 장면을 완전히 무시한다. 버스 내부는 저녁 햇살로 따뜻하게 밝혀져 있고, 카메라는 승객의 시점으로 고정되어 정면을 촬영한다.
고품질 영상: 아름다운 일본 여성. 코스매트한 현대 카페의 커피 카운터 뒤에 선 상태. 피부는 하얗고, 귀 길이의 단발에 히메 스타일 컷, 곧은 앞머리와 볼 길이의 옆머리. 단지 어두운 녹색 바리스타 앞치마만 걸치고 있으며, 목과 허리에 매달려 있어 가슴 전체를 드러냈다. 큰 자연스러운 가슴은 앞치마 낮은 허리선 위로 부드럽고 완전히 보인다. 발기된 PENISLORA 음경은 허벅지 사이에 자연스럽게 부착되어 있으며, 앞치마 허리선 아래 끝부분이 살짝 드러난다. 다리는 약간 벌어져 있고, 따뜻하게 미소 짓며 카메라를 직시한다. 두 손으로 두 개의 포장 커피컵을 들고 자랑스럽게 내민다. 그녀의 고환은 앞치마 원단 뒤에 부드럽게 놓여 있으며, 특정 각도에서 보인다. 카메라는 위쪽에서 약간 전방으로 향해, 머리에서 무릎까지 전신을 밝고 따뜻한 스타벅스 스타일의 배경에서 촬영한다.
부정적 프롬프트:
선명한 색조, 과노출, 정지된 이미지, 세부정보 흐릿, 자막, 스타일, 작품, 그림, 화면, 정지, 전체 회색, 최악의 품질, 저품질, JPEG 압축 잔여물, 추한, 불완전한, 추가 손가락, 나쁜 손, 나쁜 얼굴, 비정상적인, 흉터, 비정상적인 신체, 손가락 융합, 정지된 장면, 혼란스러운 배경, 세 개의 다리, 뒤로 걷는, 흐린 눈, 낮은 세부 정보 얼굴, 워터마크, 레이어, 결함, 얼굴, 화면 잔상, 이미지 간섭,
배경:
512x512 해상도의 이미지 28장과 640x480 해상도의 영상 3개(16fps, 약 65프레임)로 학습했습니다.
Hearmeman이 만든 훌륭한 튜토리얼과 Runpod 환경을 사용하여 학습했습니다. 설정은 기본값을 따랐으며, 이미지의 반복 횟수만 5로 조정했습니다. 또한 Seruva19의 Ghibli LoRA와 그가 공유한 학습 데이터에 큰 감사를 드립니다. 이 자료가 없었다면 이 작업을 하지 못했을 것입니다.
기존 65프레임에 추가로 61프레임 커스텀 버킷을 추가했습니다.
대부분의 이미지와 영상에서 얼굴을 자르고, 1~2장만 얼굴이 포함되어 있습니다.
약 3.5k 스텝에서 Epoch 46에서 학습을 종료했습니다. 손실에 어떤 문제도 없었으며, 몇 시간 더 학습해도 무리 없을 것 같습니다.
이 학습은 Runpod의 H100S에서 약 10시간 소요되었고, 약 33달러가 들었습니다. 홍보와 피드백을 정말 감사드립니다 :)
또한 모든 영상은 클리핑되어 16fps로 변환되었고, 각각 약 3~4초 길이입니다. 이는 저에게 WAN 학습을 처음 시작하는 초보자로서 매우 좋은 학습 경험でした.
이미지 캡션은 Joy Caption으로 자동 생성한 후, 젠더 프로존(모두 여성 대명사로), 정액을 'cum'으로 변경하는 등 수동으로 문구 일관성 조정했습니다. 영상 캡션은 수동으로 작성했습니다.
이 LoRA를 만들게 된 이유는 기존 Wan에 있는 발기 음경 LoRA들이 훌륭하지만, 너무 거대한 음경, 수술 흉터, 남성 대상으로 학습된 것, 또는 과도한 태닝 라인 등이 불만이었기 때문입니다. 이 데이터셋은 전부 성전환 여성 대상이며, 자연스럽고 여성스러운 몸매와 가슴을 가진 여성의 사진을 중심으로 했고, 너무 거대한 음경은 최대한 배제했습니다(약간은 포함되어 있음). 영상에는 정액이 나오는 장면이나 자위 장면도 포함되어 있지만, 현재 LoRA 상태에서는 이 두 가지를 잘 구현하지 못합니다. 저는 이 모델을 젯크 프리 또는 하드코어하지 않은 비디오에 추천합니다. 그러나 자위 및 정액 장면에서도 일부 성공적인 결과를 얻었습니다. 이 모델은 클로즈업과 아래에서 위로 올라가는 카메라 각도에서 특히 뛰어납니다. 다만, 이 LoRA는 남성에도 완벽하게 잘 작동하므로 걱정하지 마세요.
팁 (v0.6 업데이트 기준):
음경을 몸의 올바른 위치에 고정해야 합니다. 예를 들어 아래와 같이 포함하세요:
그녀의 발기된 음경은 허벅지 사이에 자연스럽게 부착되어 있다.
정액은 이전 버전보다 약간 더 잘 학습되었습니다. 음경 끝에서 나오며, 이전 버전보다 더 정액처럼 보입니다. 하지만 여전히 더 많은 학습이 필요합니다.
그녀의 입은 닫혀 있고 건조하며, 입술 근처에 액체가 없다. 진한 흰색 정액이 그녀의 음경 끝에서 뿜어져 나온다.
이번 LoRA는 프로필, 상단 각도 등 다양한 각도를 학습했지만, 아직 POV 각도는 구현되지 않았고, 음경 끝부분은 정면 시점에 편향되어 있습니다. 향후 버전에서 더 개선할 예정입니다. 정면에서 벗어나는 각도에서는 이상하게 보이는 음경이 나올 수 있습니다.
다른 LoRA와 병합해 테스트해본 결과, 대부분 유연하게 잘 작동했습니다. 하지만 혼합 시 강도를 조정해 보시길 권장합니다.
이 새 버전은 음경을 길게 만들倾向이 있지만, 작은 음경도 생성할 수 있습니다. 때로는 너무 긴 음경이 나오지 않도록 프롬프트나 시드를 조정해야 할 수 있습니다.
입은 이제 자연스럽게 음경 쪽으로 움직이며 빨아들이는 동작을 학습했습니다. 또한 “딥스로트”라는 단어와 콘텐츠를 학습 및 캡션에 포함시켰습니다.
경고:
이 모델을 “베타”로 표시한 이유는 아직 완성되지 않았다고 느끼기 때문입니다. 매우 자연스러워 보이는 음경을 얻을 수 있지만, 동시에 기괴한 괴물 음경이 나오기도 매우 쉽습니다... 향후 미세 조정을 하고 학습을 계속 진행할 예정입니다. 다음 큰 프로젝트는 제가 좋아하는 다른 애니메이션을 위한 Ghibli LoRA와 유사한 작업을 하는 것입니다. 이 LoRA 덕분에 WAN 학습 초보자로서 데이터셋 준비와 영상 캡션 작성 방법을 배울 수 있었습니다. 가능하다면 _건설적인 피드백_을 주시기 바랍니다. 이를 통해 이 LoRA를 더 안정적이고 유용한 상태로 발전시킬 수 있을 것입니다. 현재 상태에서도 충분히 실용적인 결과를 제공할 수 있으니, 시도해보시기 바랍니다.