TwinkCockFlux_alpha

세부 정보

모델 설명

TwinkCockFlux (alpha43000)

이것은 제가 공개적으로 게시한 세 번째 주요 LoRA입니다. 이 LoRA는 대형 언어 모델(LLM)을 사용해 효과적인 LoRA를 생성하는 방법을 배우는 과정의 연장선입니다.

이 버전은 43,000스탭까지 학습되었습니다. 이 스탭 수에서 LoRA는 종종 음경을 생성하지 못하거나 약간 흐릿해질 수 있습니다. 배치 생성을 권장합니다. 이 스탭을 넘어서면 LoRA가 과적합되어 프롬프트 준수력이 떨어지고 환각이 증가하며, 음경이 너무 과도하게 표현되어 미적 매력을 잃게 되었습니다.

이 LoRA는 Flux_1.dev 모델을 사용해 음경을 생성하는 개념 LoRA입니다. 이 LoRA의 목표는 다음과 같습니다:

  • 할례된 음경 생성
  • 의류와 상호작용하는 할례된 음경 생성
  • 동일한 이미지를 범주적으로 다른 태그로 라벨링하는 것의 타당성 테스트

이 LoRA를 알파 버전이라 부하는 이유는, TwinkCockXL과 마찬가지로 대부분의 경우 작동하지만 여전히 완벽하지 않기 때문입니다.

이 LoRA는 TwinkCockXL의 기본 이미지 세트를 기반으로 학습되었으며, 다음과 같은 주요 추가 사항이 있습니다:

  • 아시아계, 흑인, 라틴계 젊은 남성의 표현이 더 많아졌고, "포스트-트윈크" 연령대의 남성들도 추가되었습니다. 여전히 대부분의 이미지는 백인 트윈크입니다. 이 LoRA는 TwinkCockXL보다 맥락에 더 의존적이며 연령에 덜 민감합니다.

    • 추가 설명: 추가 테스트 결과, 머리카락 색상과 조명은 비백인 생성과 상호작용하는 것으로 나타났습니다. 검정색 또는 갈색이 아닌 머리카락 색상은 아시아계, 흑인, 라틴계 캐릭터 생성을 흐리게 만들 수 있습니다. 극도로 어두운 조명은 흑인과 남아시아계 생성을 혼동할 수 있습니다. "그의 머리 위에 희미한 흰색 조명"을 추가하면 이 문제를 해결할 수 있습니다.
  • Stable Diffusion의 70개 태그 제한을 극복하기 위한 다른 태깅 전략: 각 이미지는 세 가지 방식으로 태그되었습니다.

    • 음경: 음경 설명(인종, 발기 상태, 크기, 의류와의 특수 상호작용)

      • {white, black, latino, asian}; {flaccid, semi-erect, erect}; {small-sized, average-sized, large-sized}
    • 가이드: 사진의 주인공 설명(인종, 체형, 머리카락 색상과 스타일, 의류)

    • 일반적: 사진 전반적 설명(사진 구성, 촬영 각도, 촬영 시기, 촬영된 연대, 사용된 카메라 종류, 조명 및 색조)

  • "비행하는 정액(Flying Cum)"을 "마법의 순간"이라는 실험적 개념으로 추가했습니다.

주요 활성화 태그 "twinkcockFlux"는 모든 이미지에 추가되었습니다. 다음 하위 개념에는 보조 태그(단일 단어 태그 및 자연어 문장)도 추가되었습니다:

  • "cutbetweenpantsandshirtFlux", "his penis is between his pants and shirt" — 셔츠와 하의(바지, 반바지, 속옷)를 입은 남성의 음경이 하의와 셔츠 사이에서 드러난 모습

  • "cutcockthruflyFlux", "his dick is poking through his fly", "his penis is poking through his fly" — 하의의 플라이를 통해 할례된 음경이 드러난 남성

  • "cutcockthrulegholeFlux", "his penis is slipping out of his leghole", "his penis is poking out of his leghole" — 하의의 다리통(leghole)을 통해 할례된 음경이 드러난 남성 (일관성 부족, 반바지를 명시해야 할 수도 있음)

  • "cutnopantsFlux", "he is not wearing pants" — 셔츠는 입고 있지만 하의를 입지 않은 남성의 할례된 음경이 드러난 모습

  • "cutnoshirtFlux", "he is not wearing a shirt" — 하의는 입고 있지만 셔츠를 입지 않은 남성의 할례된 음경이 드러난 모습

  • "cutfullynudeFlux", "he is fully nude" — 어떤 옷도 입지 않은 채 할례된 음경이 드러난 남성

  • "cutflyingcumFlux", "He is holding his erect penis and having an orgasm" 또는 "he is holding his erect penis, he is having an orgasm, he is jerking off, he is cumming, he is masturbating" — "마법의 순간"에 있는 할례된 음경을 가진 남성

무작위성을 원한다면 보조 태그 사용은 필요하지 않습니다. 특정 하위 개념을 원한다면, TwinkCockXL과 달리, Flux는 단일 단어 보조 태그와 자연어 문장을 함께 추가하면 프롬프트 준수력이 더 향상됩니다. 일관된 생성을 위해서는 보조 태그들이 서로 모순되지 않도록 해야 합니다.

cutflyingcumFlux 데이터셋은 다른 보조 개념과 교차 태그되었으며, 이로 인해 명시되지 않아도 '예상치 못한 사정'이 발생할 수 있습니다. 이 현상이 LoRA의 결함인지 기능인지 저는 아직 판단하지 못했습니다. 이 하위 개념의 원천 이미지 특성상, 앉아 있는 자세나 음경을 잡고 있는 프롬프트에서 더 자주 생성됩니다. 이 보조 개념은 실험적이며 일관되지 않으므로 강도 1.2를 권장합니다.

샘플러, 스케줄링, Clip 관련 참고사항:

  • 초기 테스트는 Comfy-UI와 커스텀 워크플로우를 사용해 진행되었습니다. 이 게시물의 샘플 생성 후반부에서 ForgeUI가 Comfy-UI 워크플로우보다 더 일관된 생성 결과를 낸다는 사실이 발견되었습니다. 이는 Comfy-UI 워크플로우의 프로그래밍 방식에 기인한 것으로 보입니다.

  • 권장 가이던스 범위는 2.8~3.5입니다. Forge UI로 이 게시물의 이미지 샘플을 생성할 때, 2.8은 더 실재하는 조명과 대비를 생성하지만 흐릿한 음경을 선호하고, 3.5는 전반적으로 더 선명한 이미지를 생성하지만 HDRI처럼 대비가 과도해질 수 있습니다.

  • 샘플러 중 heun, euler, ipndm, deis는 유사한 결과를 내며, heun과 deis가 선호됩니다. Comfy-UI의 dpm_adaptive는 동일한 시드로 다른 결과를 생성하므로, 자주 두 개 이상의 생성 결과(예: XY 플로팅)를 생성하는 것이 좋습니다. Forge UI에서는 dpm_adaptive를 사용하면 성공적이지 못했습니다.

  • Beta가 가장 일관된 샘플러였습니다.

  • 38~58스탭이 가장 일관되며, 이는 샘플러와 기타 설정에 따라 달라집니다.

  • 테스트용 잡음 주의 가이던스(Perturbed Attention Guidance)는 2.60~2.95로 설정되었습니다.

  • 최대 시프트(Max shift)는 1.15로, 베이스 시프트(base shift)는 0.5로 설정되었습니다.

  • 하드웨어 사양 상, 이 LoRA의 대부분의 테스트는 flux1-dev-Q5_K_S 모델을 사용했습니다.

  • 원본 Clip-L 모델 사용을 권장합니다. 다른 미세 조정된 Clip 모델을 사용하면 품질 저하, 환각 증가, 프롬프트 준수력 상실이 나타났습니다.

기타 참고사항:

  • TwinkCockXL과 달리, TwinkCockFlux는 특정 연령대에 대한 학습을 포함하지 않았습니다.

  • TwinkCockXL과 유사하게, TwinkCockFlux는 "he is wearing a necklace", "he is wearing airpods", "there is sunlight across his body", "he is wearing a baseball cap"와 같은 개념을 충분한 수준으로 포함하여 일관되게 생성합니다.

  • 사진 촬영 시기(예: "1970년대 촬영", "2020년대 촬영")가 추가되었습니다. 이로 인해 의도치 않게 디지털 사진의 품질이 해당 시기 수준으로 낮아졌습니다(예: 2000년대 초반 저해상도 디지털 카메라처럼 흐릿함). 흐릿함이 발생하면 "2020년대 촬영" 또는 "2020년대 촬영"이라고 명시적으로 지정해 보세요.

  • 학습 시작 당시 이용 가능한 자료의 제한으로, 얼굴이나 배경을 마스킹하지 않았습니다. 이 LoRA는 얼굴 생성에 영향을 주며 다른 LoRA와 상호작용합니다.

  • 훈련 데이터에는 여성은 포함되지 않았고, 여성 캐릭터를 명시했을 때 어떤 결과가 나올지 확신할 수 없습니다. 아마도 생성된 인물 모두에 음경이 추가될 가능성이 있습니다. 향후 여성 포함 계획은 없으며, 관련 원천 이미지가 없기 때문입니다.

  • 음경이 보이지 않는 뒷모습 사진은 데이터셋에 포함되지 않았습니다.

  • 여러 남성의 사진은 일부 포함되었으나, 일관되게 고품질 이미지를 생성할 수 있을 정도의 수량은 아니었습니다.

  • 정규화 이미지가 사용되었으나 비중이 매우 낮았습니다. 생동감 있는 사진 외의 스타일 유연성에 대한 광범위한 테스트는 수행되지 않았습니다.

이 LoRA는 약 14,800장의 이미지(중복 및 플립 포함)를 1024x1024 해상도로만 사용하여 학습되었습니다. 각 보조 개념의 수를 균형 있게 맞추기 위해 중복 이미지를 활용했습니다.

이 LoRA의 지원, 조언, 베타 테스트에 감사드립니다: @markury, @spiritparticle, @wolffur666456 및 Bulge Discord 서버의 멤버들 https://thebulge.xyz

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.