C00M - Cum [Flux]
세부 정보
파일 다운로드
모델 설명
지금까지 가장 만족스러운 결과를 얻은 것 같아요!
84장의 수동으로 선택하고 자른 사진을 사용하여 학습했으며, 모두 1024*1024 해상도입니다. 캡션은 간단하고 미니멀하며 대충 만들었지만 정확합니다. 저는 한 개의 토큰을 트리거 단어로 도입해 캡션 중간에 사용했습니다:
- «C00M이 있는 여자 사진» followed by short and simple contextual clues like «face and in her mouth.».
이 방식이 모델이 C00M이 무엇인지 매우 잘 인식하게 만들었고, 학습 데이터와 완전히 다른 상황에도 일반화할 수 있게 해주었습니다.
학습에 사용된 이미지 중 단 하나도 완전한 얼굴을 담고 있지 않습니다. 대부분은 얼굴의 약 30% 정도이며, 몇 장은 조금 더 많아서 최대 45% 정도입니다. 이로 인해 캐릭터 LoRA와 잘 어울리는 것 같지만, 아직 충분히 테스트해보진 않았습니다.
Flux의 일반적인 특징처럼, 낮은 가이던스에 더 많은 토큰을 사용하면 현실감이 향상되며, 높은 가이던스는 프롬프트 준수는 더 잘 하지만 인공적인 완성도가 높아지는 단점이 있습니다.
제가 GPU를 보유하지 못한 절망적인 상황이라, 대부분 휴대폰으로 HF에서 확산 모델을 실험합니다. 휴대폰은 출력물을 메타데이터 없이 .jpg로 저장하기 때문에 갤러리 사진에는 이 정보가 없습니다. 유일한 예외는 이 Civitai에서의 학습 실행 결과입니다(정사각형 이미지).
알고 싶다면, 생성 정보는 다음과 같습니다:
HF 기반 모델: Camenduru/Flux.1-dev-diffusers. 이 것이 일반적인 base dev와 다른지, 단순한 미러인지 모릅니다.
샘플러/스케줄러: 모르겠습니다.
28단계
가이던스: 2-3.5
LoRA 강도: 1.15
프롬프트는 약간씩 다릅니다. 때때로 «opalescent stringy blobs of C00M»이나 «a mix of chunky blobs and thick viscous liquid C00M»을 포함하지만, 단순히 «C00M»만으로도 잘 작동합니다.
입 안이 실제로 채워지는 모습은 전혀 생성하지 않으며, 혀 위에만 있고 흘러내리는 모습만 생성합니다. 여러분이 입 안이 채워진 결과를 얻었다면 알려주세요.
또한, 아래에 여러분의 결과를 올려주세요!
학습 정보(개선할 점이나 조정할 사항이 있다면 알려주세요):
84장의 사진
8400단계
학습률: 0.00010
배치 크기: 2
두 네트워크 모두 32
나머지 옵션은 그대로 유지



















