Caricatures style TDXL
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
이 어댑테이션은 Think Diffusion XL과 함께 작동하도록 훈련되었습니다.
((높은 랭크 & 낮은 알파, no= ~0.018, clip skip:1, BRS=64, 100% 노이즈에 대해 타임스텝 적용 (& Img2Img에는 적합하지 않음. Img2Img 버전도 곧 출시할 예정입니다), SDXL 전용; 1024 x 1024, 640 x 1536, 768 x 1344, 832 x 1216 및 896 x 1152에 최적화됨.))
권장 설정
샘플러: Euler A & 스텝: 15에서 30. 최적 구간은 18에서 22입니다.
CFG: 이 어댑테이션은 많은 차원을 가지고 있으므로, 모델보다 분류기 가이던스에 더 많은 초점을 두는 것이 좋습니다. CFG는 15 이상이어야 합니다. CFG 18~21은 훌륭한 결과를 생성했습니다. 21 이상의 일부 결과가 더 우수했지만, 이는 매우 특수한 케이스였으며, 이 경우 세밀하게 튜닝된 것으로 간주되어 유연성이 낮습니다.
디노이징 강도 (Img2Img 전용): 0.85 미만은 종종 얼굴을 조각처럼 만듭니다. (0.85)는 여러 LoRA 강도에서 더 현실적인 결과를 생성했습니다.
LoRA 강도: 1 미만은 추천하지 않습니다. 1.15~1.25가 적절했습니다.
테스트하여 효과가 확인된 사항:
긍정적 프롬프트: "카리커처 스타일, 솔로, 초상화, 단순한 배경, 시청자 바라보기, 리얼리스틱, 셔츠, 모노크롬, 회색조, 흰색 배경, 스케치, 상체, 사인, 코, 칼라 셔츠, 전통 미디어, 재킷, 흰 셔츠, 두꺼운 눈썹, 공식적, 풍자, 아티스트 이름"
(풍자 또는 리얼리스틱을 제거하면 출력이 변경됩니다. 사인과 아티스트 이름을 부정적 프롬프트로 이동하면 사인이 제거될 것입니다. 이는 이 스타일의 특징이므로 저는 선호합니다.)
기본적으로 잘 작동하는 얼굴 특징: 닫힌 입, 미소, 입술, 이빨, 검은 눈, 갈색 눈, 열린 입, 웃는 얼굴
성별 관련: 남성 중심, 1boy, 1girl, 여성 중심, 보석, 남성스러움, 여성 중심
나이: 노인, 나이 많음, 주름진 피부, 젊음, 어린이
머리카락: 안면 털, 콧수염, 단발, 긴 머리, 수염
"카리커처 스타일 드로잉 of null, null2, 솔로, 초상화, 단순한 배경, 시청자 바라보기, 리얼리스틱, 셔츠, 모노크롬, 회색조, 흰색 배경, 스케치, 상체, 사인, 코, 칼라 셔츠, 전통 미디어, 재킷, 흰 셔츠, 두꺼운 눈썹, 공식적, 풍자" = 많은 테스트에 사용됨
좋은 부정적 프롬프트: 사진, 리얼리스틱한 묘사, 섬세한 표현, 자연주의적 묘사, 진정성 있는 표현, 현실적인 렌더링, 과장되지 않은 묘사, 사실적 표현, 문자적 묘사, 정확한 유사성, 추상 미술, 인상파, 리얼리즘, 미니멀리즘, 초현실주의, 입체파, 포인티리즘, 하이퍼리얼리즘, 사진적 리얼리즘, 워터마크
Img2Img 모델: ((높은 랭크 & 낮은 알파, no= ~0.018, clip skip:1, BRS=64, 300분/700최대 노이즈에 대해 타임스텝 적용. 대량의 연구 데이터를 잃어버려 이 버전을 원본과 동시에 출시하게 되었습니다, SDXL 전용; 1024 x 1024, 640 x 1536, 768 x 1344, 832 x 1216 및 896 x 1152에 최적화됨.))
원본 이미지를 할로로 감싸는 것이 일반적이며 이 스타일의 특징으로 간주되지만 아직 완벽히 구현하지 못했습니다. 이를 방지하려면 배경을 제거하세요. CFG가 이처럼 높은 경우, 모델이 인물을 익숙하게 알고 있다면 더 나은 결과를 산출합니다. 따라서 유명인은 가족 사진보다 더 나은 Img2Img 결과를 얻을 수 있습니다. ControlNet이 이를 개선할 수 있으나, VAE 문제로 인해 수일간의 연구가 무용지물이 되어 테스트하지 못했습니다.
흔한 실수: "Caricature style" 대신 "Caricatures style"을 사용하세요. 둘 다 사용해도 되지만 끝에 S를 붙인 버전을 사용하는 것이 좋습니다.
Img2Img용 이미지 선택: 상관없습니다. 한 유명인의 Stable Diffusion 생성 초상화를 사용했고, 동일한 이미지가 다른 15명에게도 잘 작동했습니다. Img2Img 버전은 ControlNet과 매우 유사합니다. 디노이징을 낮추면 반대 효과가 나타날 수도 있지만, 저의 테스트에서는 낮은 디노이징이 마음에 들지 않았습니다.
이 LORA는 오랜만에 발표하는 것이며, 어떤 사람을 복제하거나 포르노를 생성하는 데 사용되지 않았습니다. 물론, 귀하의 체크포인트가 그런 것들을 훈련했다면, 이 LORA로도 재미있는 결과를 만들어낼 수 있을 것입니다. 올해 4월에 제 원래 LORA 수십 개가 삭제되었고, 이후 작업을 공개할 가치가 없다고 판단했습니다. 하지만 기여하는 것도 좋아합니다. 유명인과 일반인 사이에 차별이 있는 것 같지 않으며, 왜 어떤 유명인 LORA는 허용되고 어떤 것은 허용되지 않는지 이해할 수 없습니다. 어쨌든, 우리는 지금 가진 것을 감사하게 생각합니다.
이 LORA는 특정 인물의 이름으로 훈련되지 않았으며, 카리커처와 풍자의 예술 자체를 훈련했습니다. 이는 사실 매우 복잡하며, 저 스스로는 이를 그릴 수 없기 때문에,人人都이 이 방식의 적절한 카리커처를 재현할 수 있도록 만들고 싶었습니다. 이 LORA를 사용할 때는 가장 좋은 시드를 저장하세요!
또한 B 및 C 버전도 보유하고 있으며, 원하시면 공개할 수 있습니다. 제 경험상 이들은 매우 유사했고, 동일한 LORA를 6버전으로 내놓는 것은 원하지 않았습니다.



















