LIPS
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
LIPS(Long Indecently Pierced and Sagging)는 2016년부터 수집해 온 제 개인 이미지 컬렉션을 기반으로 훈련된(즉, 세밀 조정된) 체크포인트/모델입니다.
제가 원하는 스타일을 가진 이전 버전의 모델들을 혼합/병합할 수밖에 없어, 자체 데이터셋으로 모델을 훈련해야 했습니다. SDXL이 새롭거나 커뮤니티가 충분히 훈련하지 못했기 때문입니다.
재미있는 사실: 아무도 "LGTM SHIPPY IT"라고 말하지 않았습니다
(참고: Luminaverse XL)
이야기 시간: 이 모델을 훈련하기 위한 영감은 개념 이해를 위해 AutismMix, 좋은 기본 스타일을 위해 Luminaverse XL, 전체 구성 이해를 위해 Animagine XL v3.1입니다(단, 미세한 디테일은 빠짐). 이들 모델과 30개 이상의 다른 훈련된 모델을 병합해 보았지만, 일부는 잘 병합되지 않았고, 블록 수준에서 병합을 시도한 결과, 자체 모델을 훈련하는 것이 더 효율적일 것이라고 판단했습니다.
이것은 완전히 망가지지 않거나 기본 모델과 거의 동일하지 않은 첫 번째 시도입니다. 훈련에는 약 80 GPU 시간이 소요되었으므로, 후속 버전이 나오면 제 PC를 3일 이상 떠나야 할 것입니다.
주요(첫 번째) 훈련은 8997장의 이미지 데이터셋을 사용하여 Danbooru 스타일의 캡션을 적용해 훈련된 모델이 제 프롬프트를 이해하도록 했습니다. 그 후, 첫 번째 훈련에서 손상된 U-Net을 교정하기 위해 '즐겨찾기'된 이미지만을 사용하여 두 번째(세밀 조정) 훈련을 도입했습니다.
캡션은 기본 모델의 토큰에 맞춰 약간 수정되었습니다:
# 해당 danbooru 검색 → 캡션에 포함된 토큰
score:150.. → masterpiece
score:100..150 → best quality
score:75..100 → great quality
score:25..75 → medium quality
score:0..25 → normal quality
score:-5..0 → low quality
score:..-5 → worst quality
rating:g → safe
rating:s → sensitive
rating:q → nsfw
rating:e → nsfw, explicit
date:2021-01-01.. → newest
date:2018-01-01..2021-01-01 → recent
date:2015-01-01..2018-01-01 → mid
date:2011-01-01..2015-01-01 → early
date:..2011-01-01 → oldest
위에 언급된 것 외에 다른 메타태그(absurdres 등)는 포함되지 않았습니다.
캡션은 다음과 같은 순서로 정렬되었습니다:
artist, copyright, character, general
또한 이 카테고리도 순서가 정해져 있습니다. 즉, general 카테고리에서 첫 번째 태그는 항상 1girl 또는 1boy입니다.
대부분의 캡션은 1명의 아티스트, 12개의 저작권, 1명의 캐릭터, 1030개의 general 태그를 포함했습니다.
참고: 훈련 데이터에는 약 1700장의 1girl/1boy가 아닌 이미지가 포함되어 있습니다!
캡션 태그를 자카드 인덱스로 분석한 결과, 추론 시 최상의 결과를 얻으려면 다음(긍정적) 태그 중 적어도 하나를 포함해야 합니다:
nipple piercing, cleft of venus, long labia, clitoris, uncensored, female pubic hair, exhibitionism, anus, public indecency, clitoral hood, pussy, female masturbation, completely nude, spread pussy, urethra, object insertion, sagging breasts, pussy juice, presenting, breasts apart, anal, peeing
제한된 테스트 결과, 부정 프롬프트에 단순히 worst quality만 포함해도 모델이 매우 잘 작동합니다. 일반적으로 긍정 프롬프트에 1girl, solo, breasts를 사용합니다. 일반/메타 태그를 정렬하여 최종 프롬프트가 1girl, something, something, breasts, something, solo처럼 보이도록 합니다.
원하는 결과를 얻기 위해 하나의 부정 태그로 시작한 후 조합해 보는 것이 좋습니다. derivative work, off-topic, redrawn, 3d, render와 같은 다른 메타태그도 탐색해 볼 가치가 있습니다.
훈련 설정
훈련 설정은 각 버전 설명에 나와 있습니다.
가시성을 위해 v1.0의 설정을 아래에 기재합니다:
주요 훈련 설정:
7+7+12 에포크 (첫 두 번의 훈련 세션은 8 에포크 후 충돌. 7 에포크부터 두 번 다시 재개)
에포크 당 1회 반복
AdamW8bit 최적화기
학습률: U-Net=1e-5; TextEnc=2e-6
스케줄러: 10% 스텝을 위한 워밍업과 재시작이 포함된 코사인 스케줄러
훈련 배치 크기: 4
노이즈 오프셋 없음
8997장의 이미지
기본 모델: Luminaverse XL v1.0 + FixVAE v2
보조 훈련 설정:
25 에포크 (충돌 없음)
에포크 당 1회 반복
AdamW8bit 최적화기
학습률: U-Net=1e-6; TextEnc=0 (단, 캐싱 없음)
스케줄러: 워밍업 없이 고정
훈련 배치 크기: 4
노이즈 오프셋: 0.0357
2317장의 이미지 (이전 8997장의 하위 집합)
기본 모델: 주요 훈련의 출력
이 모델을 NSFW에 치우쳐 설계했지만, 더 많은 테스트를 진행하면서 'uncensored', 'body exploration' 등의 NSFW 컨텍스트를 제안해도 대상의 옷을 벗기지 못하는 경우가 많습니다. 때로는 작동하지만 항상 그런 것은 아닙니다. 노출을 강력히 암시하는 태그(예: "nipples" 또는 "pubic hair")를 사용하면 대부분 작동합니다.
라이선스
이 모델은 Luminaverse XL 및 그에 따라 Animagine XL 3.0의 라이선스인 Fair AI Public License 1.0-SD를 따르며, Stable Diffusion 모델과 호환됩니다. 기본 모델 페이지에서 가져온 핵심 내용은 다음과 같습니다:
수정 및 공유: 이 모델을 수정할 경우, 변경 사항과 원래 라이선스를 모두 공유해야 합니다.
소스 코드 접근성: 수정된 버전이 네트워크를 통해 접근 가능할 경우, 다른 사용자가 소스 코드를 얻을 수 있는 방법(예: 다운로드 링크)을 제공해야 합니다. 파생 모델에도 적용됩니다.
배포 조건: 모든 배포는 이 라이선스 또는 유사한 규칙을 가진 다른 라이선스 하에서 이루어져야 합니다.
준수: 위반 사항은 라이선스 종료를 피하기 위해 30일 이내에 수정되어야 하며, 투명성과 오픈 소스 가치 준수를 강조합니다.





