SDXL sufficient nudity for Unstable YamerMIX
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
직접적인 섹슈얼리티를 포함하지 않는 여성형 인간을 그려야 합니다.
제 갤러리의 이미지는 인간(Homo sapiens)이 아니라, AmourAngels, Metart, Rulsky-Art에서 찾을 수 있는 20-22세의 완전히 건강한 여성들과 유사합니다.
10-12세의 전형적인 학생 소녀들이 어떻게 생겼는지 기억하지 못하는 분들을 위해 설명드리면, 그들은 중간 또는 "작은" 가슴을 가진 ICBNP 렌더링과는 전혀 다르게 생겼습니다. 하지만 그들에게 호르몬이 풍부한 고기, 패스트푸드, 그리고 고스트레스를 지속적으로 주면, 그들은 더 빨리 성숙해 보일 수 있습니다.
사용법:
체크포인트 v5 이후에 이 LoRa를 연결하세요:
"SDXL Unstable Diffusers ☛ YamerMIX" /model/84040/sdxl-unstable-diffusers-yamermix
v8에서도 잘 작동하지만, 더 어린 얼굴을 생성합니다. 참고로, 심지어 v5에서 제 가장 좋은 렌더링도 Civitai에서 한 달 후 삭제되었습니다. 아마도 어떤 이들이 18-20세 청소년을 싫어하는 것 같습니다.
Dream Shaper alpha2 및 대부분의 다른 모델에서는 작동하지 않습니다. SDXL1.0으로 학습되었음에도 불구하고요.
v0.2의 경우 모델과 클립 강도를 0.7-0.9로 설정하세요. v0.1의 경우 0.6-0.8로 설정하세요(때로는 구성에 맞추기 위해 클립 강도를 0.25-0.3으로 낮추고, 모델 강도는 0.7-0.75 이상으로 유지하여 노출을 허용하는 것이 더 나을 수 있습니다). 사진의 경우 CFG는 3-6, 애니메이션의 경우 약간 높게 설정하세요. DPM++2m SDE는 더 세밀한 구성이 생성되지만, 스케줄러(카에르스, exp)를 설정하는 것을 잊지 마세요.
v0.2는 특별한 태그가 없습니다. 1girl(때로 과도한 주의를 받음), girl 또는 전혀 사용하지 않아도 됩니다.
v0.1은 다양한 얼굴을 가진 여성들을 유도하기 위해 활성화 단어를 사용하세요 (또는 아무것도 사용하지 않음):
- g01tt = 일반적, 대부분의 결과를 향상시킴
- g3475, g151a, g159a = 특정 캐릭터, 하지만 현재 모델은 학습이 부족하여 큰 영향을 미치지 않음
- pussy, vagina = 때로는 매우 큰 개선 효과를 줌
거대한 가슴, 돌연변이 및 스타일리시한 이미지를 피하기 위해 네거티브 프롬프트를 사용하세요 (예시 이미지 참조):
- 복잡한:
out of frame, lowres, text, error, cropped, worst quality, low quality, jpeg artifacts, duplicate, wrong proportions, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck, username, watermark, signature, bad hands, (low quality, worst quality:1.3), backlit, corrupted image, letters, words, censored, multiple fingers, multiple legs, bad hands, blur, pixelated, bad anatomy, cropped hands, artist name, extra digit, loli, fewer digit, author name, names, autograph, hand writing, written text, five legs, five legs, 3 legs, three legs, five legs, 5 legs, bad hands, bad legs, bad body shape, multiple tails, two tails, deformated body, imperfect painting, blurry hands, blurry face, blurry body, blurry image, bad eyes, ugly face, ugly eyes, repetition, ugly body
그리고
cartoon, comics, anime,
- 생생한:
(deformed, distorted, disfigured:1.3), poorly drawn, bad anatomy, wrong anatomy, extra limb, missing limb, floating limbs, (mutated hands and fingers:1.4), disconnected limbs, mutation, mutated, ugly, disgusting, blurry, amputation. tattoo, grayscale, frame, border
그리고
cartoon, comics, anime,
- 일반적인:
ugly, disfigured, deformed, bad anatomy, comics, cartoon, anime, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, extra limbs, disfigured, deformed, body out of frame, blurry, bad anatomy, blurred, grainy, signature, draft
일부 포즈는 아래와 같은 네거티브 프롬프트를 필요로 합니다:
(extra legs, vaginal penetration, penis, sex,)
데이터셋은 약 4% 정도 포함되어 있습니다.
초기 결과:
- 캐릭터들은 자신의 노출을 주저하지 않으며, 약 25%의 렌더링은 나쁘지 않아 보입니다.
- 다리를 벌리거나 무엇인가를 삽입하라고 부드럽게 요청할 수 있습니다.
- 그녀는 "SDXL Unstable Diffusers ☛ YamerMIX"가 이해하는 몇 가지 신체 포즈를 이해합니다.
- 더 세밀한 조정을 하면 더 좋은 이미지를 생성할 수 있을 것 같지만, 현재로선 최고의 1.5 모델과 img2img를 사용하면 품질이 향상되고 안정적인 결과를 얻을 수 있습니다.
- 강도를 0.6부터 시작하면 이 LoRa는 주로 구성 내에서 노출된 소녀들을 유도합니다.
단점:
- v0.2는 다리를 벌린 자세와 엉덩이에 과도한 집중을 보입니다. 낮은 강도로 이 태그를 사용하세요.
- 베이스 모델(YamerMIX v5) 때문에 과도한 미소를 보이고 애니메이션/CG 스타일로 치우치며, 네거티브(만화, 만화, 애니메이션)로도 정상화하기 어렵습니다.
- 다리 개수가 잘못된 이미지를 많이 생성하며, 적절한 네거티브 프롬프트 없으면 사용할 수 없습니다.
- 40 스텝 미만에서는 이상한 아티팩트가 생성됩니다(예시 이미지 참조).
- 최고의 1.5 모델보다 훨씬 나쁘지만, 아름다운 이미지를 생성할 수는 있습니다.
- 종종 엉덩이 아래에 돌연변이 신체가 계속 생성되며, 이는 데이터셋 내의 (태그되지 않은?) 거울과 물 반사 때문일 가능성이 높습니다.
- v0.1은 거의 항상 어떤 텍스트를 포함합니다.
- 구성과 캐릭터를 다소 추하게 만들 수 있습니다.
- 복잡한 포즈(머리 위로 다리 올리기, 다리 교차, 팔을 뺨에 대기 등)를 이해하지 못합니다.
기술 정보:
v0.2: 버전 설명 참조
v0.1:
전생동안 제가 수집한 1100장의 최고 품질 사진을 기반으로 학습되었으며, 미학적 기준에 따라 다양한 학습 반복 횟수를 적용하고, 큰 사진 세트를 피하기 위해 한 장의 사진만 포함된 인물은 더 많이 학습했습니다.
기반 모델은 sdXL_v10VAEFix이지만, "SDXL Unstable Diffusers ☛ YamerMIX"에서 사용하는 것이 더 낫습니다. 다른 모델로 학습해본 결과 품질이 더 나빴으며, 추가 테스트가 필요합니다.
학습이 부족하거나, 데이터셋이 너무 광범위하거나, LoRa 크기가 작거나, 기타 원인일 수 있습니다. 어쨌든 추가 5000 스텝은 성능을 악화시켰습니다. Prodigy 프리셋을 사용했으나 Kohya의 모든 프리셋을 시도했습니다. 100장의 극소수 최고 품질 이미지로 데이터셋을 구성해봤지만, 모든 프리셋에서 750스텝 이후 더 나빠졌고, 동시에 키워드 태그는 1000스텝까지 잘 학습되지 않았습니다.
할 일:
- 더 나은 학습, 전체 데이터셋으로 학습
- 큰 모델(체크포인트) 학습
- TOS 조사 (데이터셋은 아동 얼굴을 포함하지 않으며, 사진 촬영 당시 여성은 18-24세였고, 렌더링은 18세로 설정했지만 최고의 이미지는 차단됨)
- SDXL 리파이너 학습 시도
- 더 느린 학습률과 cos로 다시 학습 시도
- 텍스트가 포함된 데이터셋 정리 (현재 이미지당 1-3분 소요) + 텍스트 관련 태그 삭제
- 저해상도 이미지(현재 768 이하 약 10%)를 SD1.5로 업스케일하여 더 나은 구성과 포즈 다양성 확보. 업스케일 버킷이 좋지 않을 수 있음 — 조사 필요
- 단일 얼굴로 치우치는 경향을 피하기 위해 데이터셋을 더 잘 정규화
어떤 방식으로든 도움을 주고 싶다면 환영합니다. 저는 디스코드, 텔레그램 또는 기타 계정을 가지고 있지 않습니다.
