Side Doggy

세부 정보

파일 다운로드

모델 설명

나는 편을 들지 않는 타입이지만, 측면 프로필 뷰는 진짜 최고야! 오늘 여러분께 자랑스럽게 소개합니다...

사이드 도기

이 개념은 처음에 내가 감당하기엔 너무 무리였기 때문에 독특한 도전에 직면했다. 결국 6개의 클립 세트에 6개의 클로즈업을 추가해 훈련했다. 내 첫 시도에서는 세트를 반으로 나누어 일부는 왼쪽 프로필, 일부는 오른쪽 프로필을 보여주었는데, 그 결과 몸의 기괴한 변형, 돌연변이, 연결된 음경, 부실한 오라리 등이 발생했다.

이 방식으로 일관된 렌더링을 얻지 못했지만, 실패는 성장을 나타내는 특이한 방식을 가지고 있다. 두 주 동안의 실패 끝에 나는 이하의 점 아래에 상세히 설명하는 유레카의 순간을 맞이했다. 그런데 일단!

버전

원버전

이것이 유일한 버전일지도 모른다... 6e-5, 256x256 (거친 픽셀 평균)로 60 프레임. 포즈가 매우 일관되며 모두 동일한 측면에서 촬영되었다. 이는 내가 지금까지 만든 최고의 LORA 중 하나이며, 상영용으로 굳이 선택할 필요조차 없었다! (!!) 넓은 비율에서 더 뛰어나지만, 높은 비율에서도 놀라울 정도로 안정적이다.

와일드카드 프롬프트 템플릿.

아름다운 {슬림|커브가 있는} {러시아|프랑스|스웨덴|스위스|라틴아메리카|오스트리아|독일|네덜란드|영국|아일랜드|포르투갈} 여성은 개처럼 네 발로 엎드린 채 측면 프로필로 보이며, 오른쪽에 서서 왼쪽을 바라보는 {근육질|뚱뚱한|마른|체형 좋은} {아프리카|독일|미국|라틴|아시아} 남성이 그녀 뒤에서 {거대한|보통 크기의|두꺼운|작은} 음경을 그녀의 질 안으로 밀어넣고 빼내고 있다. 그의 골반은 그녀의 구부러진 엉덩이와 고관절과 수평으로 밀접하게 정렬되어 있다.  
그녀는 프레임 왼쪽 측면으로 늘어뜨려진 {블론드|갈색|더티 블론드|밝은 블론드} {스타일링된|곧은|곱슬린|묶인|폴린} 머리카락을 가지고 있다.

그는 손으로 그녀의 고관절을 {잡고|牢牢 잡고|잡아당기고} 있다. 그녀의 {{빨간|검은|흰색|분홍|다중 색} {브라|튜브 탑|셔츠}가 가슴을 덮고 있음|{큰|중간 크기의|작은} 유방이 매번 삽입할 때 떨림}.

이 장면은 밝게 조명된 현대적인 {침실|지하실|거실|공원|스튜디오|다락방|의원|작업실}에서 벌어진다.

훈련 노트

많은 고민 끝에 이 놀라운 발견이 나타났다! 이건 정말 중요하다!

HunyuanVideo:

  • 트리거 단어를 사용하지 않는다. 오히려 트리거 단어는 단순한 잡음에 불과하며, 학습 과정에 도움이 되지 않을 뿐 아니라 오히려 해로울 수 있다. 최악의 경우 전혀 쓸모없다. 왜일까?

  • HunyuanVideo의 텍스트 인코더는 캡션/프롬프트를 그대로 처리하지 않는다. 텍스트의 의미를 기반으로 의미론적으로 번역하고 자체 내부 표현을 구축한다. 비영어 단어는 의미를 전달하지 않기 때문에 어떤 가치도 추가하지 않는다. 따라서 이를 포함할 필요가 없다. 아직 확신이 없다면 이 LORA를 시도해보라. 트리거 단어 없이도 결과는 놀라울 정도로 훌륭하다.

  • 어떤 LORA도 잘못 설계된 프롬프트는 제대로 작동하지 않는다. 반대로, 약한 LORA라도 올바른 프롬프트를 사용하면 매우 잘 작동할 수 있다.

최적의 키 문구를 찾을 때, 우리는 반드시 트리거 문구를 필요로 한다. 이 문구는 우리가 훈련하려는 LORA의 포즈/개념/세부 사항을 베이스 모델이 최대한 근사하게 그려낼 수 있도록 해야 한다.

사이드 도기 스타일을 잘 작동시키고 싶다면, 베이스 모델이 전체적인 그림을 그려낼 수 있게 해주는 가장 간결한 프롬프트 문구들을 고립시켜야 한다. 결과물이 움직임이나 정확도를 놓칠 수는 있지만, 두 사람을 위한 LORA를 훈련하고 있을 때, LORA 없이 HunyuanVideo가 한 명만 그려내거나, 세 명을 그려내거나, 기괴한 변형이나 완전히 잘못된 자세를 보인다면, 그런 프롬프트는 잘 훈련되지 않고, 잘 렌더링되지도 않는다.

다수의 긴 문단 프롬프트를 시도한 끝에 베이스 모델이 제대로 그려내는 순간을 마침내 발견했고, 그 결과를 바탕으로 다음과 같은 문구를 도출했다:
**
여성이 개처럼 네 발로 엎드린 채 측면 프로필로 보이며, 오른쪽에 서서 왼쪽을 바라보는 남성이 그녀 뒤에서 음경을 그녀의 질 안으로 밀어넣고 빼내고 있다. 그의 골반은 그녀의 구부러진 고관절과 엉덩이와 수평으로 밀접하게 정렬되어 있다. 그녀는 프레임 왼쪽 측면으로 머리카락이 늘어져 있다.**

이 핵심 문단 덕분에 두 사람과 그들의 위치, 때로는 그들 사이에 음경까지도 그려낼 수 있었다. 이 순간은 승리와 안도감의 순간이었다. 이 문구와 함께 환경적 단서(예: 장소 등)를 프롬프트로 사용하자, 그동안 불안정했던 내 LORA조차도 훌륭한 결과를 내기 시작했다. 정말 훌륭한 결과였다. 하지만 나는 여기서 멈추지 않았다. 이 문구로 내 데이터 세트를 재캡션하고 밤새 훈련했다. 지금 상영용 영상을 렌더링 중인데, 거의 모든 시드가 마치 마법처럼 정확하게 결과를 만들어내는 것을 보고 놀라움을 금치 못했다. 돌연변이, 추가 인물, 뒤집힌 머리 등 전혀 없이 8/8의 완벽한 결과를 얻었다. (이제 운 나쁘게 되지 않게 조심해야지... lol)


우리는 마법처럼 작동하는 사이드 도기 스타일 LORA를 얻었을 뿐만 아니라, 이 근본적인 훈련 팁도 얻었다: 먼저 베이스 모델이 LORA의 핵심 개념을 근사하게 그려낼 수 있게 해주는 키 문구를 찾고, 그 후에 그 일관된 문구를 중심으로 캡션을 구성하라. 필요한 형용사 등은 추가하되, 이 템플릿을 마치 당신의 생명이나 LORA를 걸고 지키듯 철저히 따르라.

개념이 복잡하고 베이스 모델을 원하는 방향으로 끌어내기 위해 긴 문단의 프롬프트가 필요하다면, 더 짧은 문구를 찾을 필요가 있다. 약 40단어 이상은 길다고 볼 수 있다. 캡션이 길어질수록 프롬프트가 개념을 트리거하기가 더 어려워진다. 캡션이 짧을수록, 더 긴 상세한 프롬프트도 의미론적으로 올바른 요소를 포함하기 쉬워진다.
예를 들어, 캡션이 300단어라면, 300단어 미만의 프롬프트는 개념을 생성조차 못할 수 있다. 따라서 캡션 길이는 LORA의 성능과 강력하게 연관된다.

더 많은 훈련 노트는 내 훈련 가이드에서 확인하세요.

면책 조항

책임감 있게 사용하세요.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.