SuperMix

세부 정보

모델 설명

🍍 SuperMix는 세부 사항, 조명, 질감 및 구성의 다른 요소를 통해 반실제적인 톤을 끌어내는 애니메이션 중심의 텍스트-이미지 디퓨저 모델입니다. 동시에 이 병합된 모델은 선택한 매개변수를 통해 생성할 수 있는 스타일, 형태, 매체의 양이 매우 다양합니다. SuperMix는 다음 분야에서 뛰어납니다:

  • 초상화

  • 애니메이션

  • 반실제주의

  • 풍경

  • 콘셉트 아트

  • 세밀한 질감

  • 세밀한 배경

  • 차량, 건축물, 음식

  • 그리고 더 많은 것들!

이 믹스는 다양한 애니메이션 중심 모델들의 우연한 조합에서 시작되었습니다. 저는 병합 과정에서 뛰어난 세부 사항들을 기록하고, 그점을 강조하는 새로운 믹스를 만들기로 결정했습니다. 몇 차례의 반복과 분기 테스트를 거친 끝에, 저는 이 믹스가 충분히 우수하다고 판단하여 더 이상 다양한 변형을 추가하지 않고 그대로 타인과 공유하기로 결정했습니다.

저는 일반적으로 생성된 예술에 대해 여전히 초보자라고 생각합니다. 따라서 수정하거나 개선할 점이 보이면 알려주세요 👌

이 모델의 출력물을 이용해 사람들이 어떤 작품을 만들어내는지 보는 것이 정말 즐겁습니다. 어떤 콘텐츠를 게시하려는 경우, #SuperMix 태그를 다양한 플랫폼에서 자유롭게 사용해 주세요!

참고

SuperMix1은 2022년 말에 당시 알려진 다양한 모델들을 임의로 병합한 오래된 초기 버전 모델입니다. 따라서 이 모델과 그 병합 구성 요소는 상당히 오래되었으며, 현재의 WebUI 업데이트 등으로 인해 관리가 조금 어려울 수 있습니다. 현재는 유사한 스타일과 유연성을 갖춘 훨씬 더 우수한 모델들이 많이 존재하며, 이는 사용자의 스타일 선호에 따라 더 쉽게 사용할 수 있을 수 있습니다. 이 모델에 향후 업데이트가 있다면, 새 버전은 이 버전의 주요 문제를 해결하고, 라이선스 제한을 제거하며, 더 나은 수준으로 튜닝하는 데 초점을 맞출 것입니다.

💡 대체 버전, 모델 레시피 및 기타 정보는 Hugging Face 페이지에서 확인하실 수 있습니다.


일반 사용법

이 모델은 일반적인 설정 및 매개변수에 있어 상당히 유연합니다.
짧게 말하자면, 간단하게 시작하여 현재의 프롬프트와 가장 잘 작동하는 방식을 실험해보는 것이 좋습니다. 과거의 프롬프트와 설정을 시도해보거나, 예시를 살펴보거나, 아예 처음부터 시작해보세요. 이 모델은 좋은 프롬프트를 사용했을 때 가장 빛을 발합니다. 좋은 설정 + 프롬프트를 찾을 때까지 해부학적 오류(손 등)가 약간 어지러울 수 있으며, 이때는 분명히 느끼게 될 것입니다. 이 모델은 주로 초상화 스타일 생성을 위해 최적화되어 있음을 기억하세요.

미리보기 및 예제 섹션에는 다양한 설정의 많은 사례가 포함되어 있으므로, 본인의 스타일을 자유롭게 탐색해보세요. SuperMix는 다양한 스타일을 구현할 수 있는 매우 강력한 모델이므로, 자신이 가장 잘 활용할 수 있는 방식으로 자유롭게 사용하세요.

생성 후 낮은 디노이징 값으로 img2img 업스케일을 추가하면 출력 이미지에 깔끔한 마무리 효과를 줄 수 있습니다. 다만 설정에 따라 매우 세밀한 질감이 일부 사라질 수 있으므로, 두 업스케일을 병합하여 양쪽 장점을 살리는 것도 가능합니다.

~20 스탭, 7 스케일, ~0.4 디노이징, clip skip 1 또는 2가 좋은 시작점입니다.

이 모델은 세부 사항 정확도에 일부 문제를 겪지만, 주로 초상화 스타일에 최적화되어 있습니다. 프롬프트 및 기타 매개변수에 따라 손이나 해부학적 구조가 때때로 약간 비정상적으로 나타날 수 있음을 유의하세요.


프롬프트

SuperMix는 단순하고 복잡한 프롬프트 양쪽 모두에서 뛰어난 성능을 발휘합니다. 간단하고 작게 시작한 뒤 점차 확장해보세요. 👑 제 생각에 프롬프트는 생성 결과에서 가장 큰 영향을 미치는 요소입니다. 사용하는 프롬프트와 그 사용 방식에 주의하세요. 어떤 토큰이 다른 요소와 충돌할 수 있는지, 그리고 모든 요소가 다른 매개변수와 어떻게 상호작용하는지 확인하세요. (예: 샘플러, 단계, 스케일, 클립 스킵, 시드, LoRA 등)

참고: 아티스트 토큰은 출력에 큰 영향을 미칠 수 있으므로, 본인의 판단에 따라 사용하세요.

긍정적 프롬프트: 시작점으로 간단한 프롬프트도 충분히 효과적이지만, 약간의 구조를 추가하면 모델의 스타일을 더욱 정밀하게 지도할 수 있습니다. 다른 매개변수와 잘 어울리는 것을 자유롭게 시도해보세요. 아래는 몇 가지 시작점입니다.

(masterpiece:1.1), (highest quality:1.1), (HDR:1.0)
extreme quality, cg, detailed face+eyes, (colorful:0.8), <content>, masterpiece, 8k, tone mapping, hyper focus

부정적 프롬프트: 이 모델은 간단한 부정적 프롬프트나 부정적 임베딩만으로도 잘 작동하지만, 스타일 지향, 원치 않는 품질 등에 대해 구조화된 부정적 프롬프트를 사용하면 더욱 뛰어난 결과를 얻을 수 있습니다. 긍정적 프롬프트와 충돌하는 토큰을 피하고, 복잡하지 않게 유지하되, 효과적인 것을 모두 시도해보세요!

(bad quality:1.3), (worst quality:1.3)
EasyNegative, (bad_prompt_version2:0.8), (badhandv4:1.18), (bad quality:1.3), 
(worst quality:1.3), watermark, (blurry), (cropped), (nsfw:1.3), (cleavage:1.3)

더 많은 예제는 미리보기 이미지에서 확인할 수 있습니다.

하이레즈 픽스

  • 하이레즈 디노이징: 보통 ~0.3–0.6 사이를 사용합니다. 지금까지 다른 값은 거의 시도해보지 않았습니다. 현재의 매개변수와 프롬프트에 가장 잘 맞는 값을 실험해보세요.

  • 하이레즈 업스케일러: 다양한 업스케일러는 약간 다른 결과를 생성하지만, 저는 모두 잘 작동한다고 생각합니다. 일반적으로 사용되는 업스케일러는 잘 모르지만, 저는 주로 R-ESRGAN 4x+ Anime6B 또는 4x-UltraSharp를 사용합니다. 늘 그렇듯, 본인에게 가장 적합한 것을 사용하세요.

샘플링 단계

~18–30 단계로 시작하는 것을 권장합니다. 프롬프트, 샘플러 및 다른 매개변수에 따라 더 낮거나 더 높은 값으로 조정해보세요.

샘플러

이 모델에 대한 대부분의 테스트는 다음 샘플러를 사용했습니다:

  • Eular a

  • DPM++ 2M Karras

  • DPM++ SDE Karras

  • DDIM

또한 DPM++ 2S a KarrasPLMS 샘플러도 약간 시도해보았습니다.
나머지 샘플러는 잘 모르겠습니다. 각 샘플러는 고유한 스타일을 가지고 있으며, 프롬프트 및 기타 매개변수와 다르게 작동합니다.

보통 사용하는 샘플러를 먼저 시도한 뒤, 다른 샘플러들과 함께 실험해보세요. 어떤 샘플러가 어떤 프롬프트와 더 잘 어울리는지 확인할 수 있습니다.

일부 샘플러는 프롬프트의 특정 토큰이나 기타 매개변수를 다른 샘플러와 다르게 활용할 수 있습니다. 예를 들어, 샘플러 A와 “프롬프트 a” 조합에서 더 나은 결과를 얻을 수 있고, 샘플러 B와 “프롬프트 b” 조합에서 더 나은 결과를 얻을 수도 있습니다.

스케일

CFG 스케일은 주로 프롬프트, 샘플러 등에 따라 달라집니다. 일반적으로 기본값인 7에서 시작하여 ~6.5–10으로 조정하는 것을 권장합니다.

예를 들어 DDIM 샘플러의 경우, 프롬프트와 기타 요소에 따라 ~13–16 같은 높은 스케일에서도 좋은 결과를 얻었습니다. 그러나 낮은 값이 효과적이지 않다는 뜻은 아닙니다. 다른 샘플러 및 값 범위에도 마찬가지입니다.
자신의 프롬프트에 가장 잘 맞는 값을 직접 실험해보세요 👍

클립 스킵

  • 클립 스킵 1 – 대부분의 샘플러와 잘 작동하며, 제 경험에 따르면 특히 Euler a와 매우 잘 어울립니다.

  • 클립 스킵 2 – 대부분의 샘플러와도 잘 작동하며, 샘플러 및 기타 매개변수에 따라 프롬프트의 토큰을 더 ‘문자 그대로’ 해석하는 경향이 있습니다.

둘 다 훌륭하게 작동하며, 각각 다른 스타일과 결과를 생성합니다. 이것이 제가 다른 테스트 모델 변형을 거부한 이유 중 하나입니다. 두 클립 스킵 변형 간의 품질 불균형이 있었기 때문입니다. 두 가지 모두 시도해보거나, 내장된 X/Y/Z 플롯 스크립트를 사용하여 동일한 생성 과정에서 함께 사용해보세요.

더 높은 값(3–6)도 시도해볼 수 있습니다. 저는 클립 스킵 3–6에서 좋은 결과를 본 적이 있습니다.

VAE

선호하는 VAE를 사용하세요. 저는 일반적으로 vae-ft-ema-560000-ema를 사용합니다.

  • "SuperMix_A.vae" (SD vae-ft-ema-560000-ema.vae로 이름 변경)
    권장 – 밝고 생생한 색상

  • "SuperMix_B.vae" (kl-f8-anime2.vae로 이름 변경, Hugging Face 페이지에서 찾을 수 있음)
    매우 유사 – 가끔 다른 세부 사항

  • "SuperMix_C.vae" (Anything_v3.vae로 이름 변경, Hugging Face 페이지에서 찾을 수 있음)
    다른 옵션 – 비교적 중간 수준의 색상/ 채도

vae-ft-mse-840000-emaClearVAE_V2.3도 좋은 옵션입니다.

참고: "-bv" 또는 "-bakedVAE"가 포함된 모델명은 VAE 파일이 내장되어 있어, 별도의 VAE 파일 사용이 불필요합니다.

업스케일링

생성 후 추가 img2img 업스케일링은 이 모델의 이미지 선명도를 향상시키고 세부 사항을 정리하는 데 매우 효과적입니다. 다만 설정에 따라 텍스처 세부 사항이 부드러워질 수 있으므로 유의하세요. 물론 필수는 아니지만, 생성 결과를 더욱 선명하게 만들 수 있습니다. 본인에게 가장 잘 맞는 설정이나 확장 프로그램을 사용하세요.

저는 일반적으로 다음 설정으로 내장된 SD 업스케일 스크립트를 사용합니다:

  • 동일한 베이스 모델

  • 동일하거나 유사한 프롬프트

  • DPM++ SDE Karras 샘플러

  • 20 샘플링 단계

  • 7 CFG 스케일

  • 낮은 디노이징 강도 ~0.08–0.3

  • 랜덤 시드, -1

  • 타일 중첩 ~176–208

  • 확대 비율 x2

  • 업스케일러: R-ESRGAN 4x+ Anime6B 또는 4x-UltraSharp

  • LoRa 는 일반적으로 비활성화

ENSD 및 Eta

WebUI 기본값만 사용했습니다:

  • 0 Eta 노이즈 시드 델타

  • 0 DDIM용 Eta (노이즈 곱셈기)

  • 1 유사 샘플러용 Eta (노이즈 곱셈기)

기타 설정

예제 이미지에는 다음 설정을 사용했습니다: settings/compatibility/use old karras scheduler sigmas (0.1 to 10) — 이 설정은 Karras 샘플러에 영향을 미칩니다. 완전히 선택 사항이며 필요하지 않습니다. 이 설정은 이전 버전의 WebUI를 더 정확하게 재현합니다. 저는 이 설정을 끈 상태로 최신 WebUI 버전에서 충분히 테스트해보지 않았습니다.

면책 조항

사용된 매개변수에 따라 이 모델은 의도치 않게 NSFW 콘텐츠를 생성할 수 있습니다. 따라서 프롬프트를 적절히 조정하세요. 예: 부정적 프롬프트에 "nsfw"를 포함하세요.

이 모델을 공유하는 목적은 공공 장소에서 저속한 콘텐츠를 보여주기 위함이 아닙니다. 이 학습 모델의 사용은 사용자의 자율에 달려 있으며, SFW 또는 NSFW 콘텐츠를 생성할지 여부를 자유롭게 선택할 수 있습니다. SFW 또는 NSFW 콘텐츠를 접할 것인지의 결정은 사용자의 개인적 선호에 달려 있으며, AI 모델에는 쉽게 접근할 수 있는 명시적인 시각적 콘텐츠가 포함되어 있지 않습니다.

사용된 예제 이미지

  • vae-ft-ema-560000-ema VAE

  • 4x-UltraSharp 또는 R-ESRGAN 4x+ Anime6B 업스케일러

  • 하이레즈 픽스 + SD 업스케일을 통한 추가 업스케일링

  • use old karras scheduler sigmas (0.1 to 10) 호환성 설정 사용

  • 사용된 모든 LoRa는 이미지 메타데이터에 명시되어야 함

  • Bad_v2 부정적 임베딩은 bad_prompt_version2와 동일해야 함

  • EasyNegativebadhandv4 부정적 임베딩도 사용됨

*부정적 임베딩은 선택 사항입니다

참고

SuperMix1은 처음에 AUTOMATIC1111 WebUI의 훨씬 오래된 버전(https://github.com/AUTOMATIC1111/stable-diffusion-webui/tree/4b3c5bc24bffdf429c463a465763b3077fe55eb8)에서 병합 및 테스트되었습니다. 따라서 Karras 샘플러를 사용하거나 예제 이미지를 재현하려는 경우, -> settings/compatibility/use old karras scheduler sigmas (0.1 to 10) 호환성 설정을 활성화하는 것을 권장합니다. 이 설정은 완전히 선택 사항이며 필요하지 않습니다. 저는 이 설정을 끈 상태로 최신 WebUI 버전에서 충분히 테스트해보지 않았습니다.

라이선스 및 사용

이 모델은 모든 사용자에게 오픈 접근 가능하며, 수정된 CreativeML OpenRAIL-M 라이선스에 의해 권리 및 사용 조건이 명시됩니다.

1. 모델을 의도적으로 불법적이거나 해로운 출력물이나 콘텐츠를 생성하거나 공유하는 데 사용할 수 없습니다.

2. 저자들은 귀하가 생성한 출력물에 대한 권리를 주장하지 않으며, 귀하는 이를 자유롭게 사용할 수 있으며, 사용 책임은 귀하에게 있으며, 이는 라이선스에 명시된 조항을 위반해서는 안 됩니다.

3. 가중치를 재배포할 수 있습니다. 재배포하는 경우, 라이선스에 명시된 동일한 사용 제한을 포함하고, 수정된 CreativeML OpenRAIL-M 라이선스 사본을 모든 사용자에게 공유해야 합니다(라이선스 전체를 꼼꼼히 읽으십시오).

전체 라이선스를 반드시 읽어주세요: Stable DiffusionDreamlike Diffusion 1.0.

(RT 변형 은 Dreamlike Diffusion 라이선스의 적용을 받지 않습니다)

사용 제한

귀하는 이 모델 또는 이 모델의 파생 모델을 다음 목적으로 사용하지 동의합니다:
- 적용 가능한 국가, 연방, 주, 지방 또는 국제법 또는 규정을 위반하는 방법으로
- 미성년자를 착취하거나 해치거나, 착취하거나 해치려는 목적을 위해
- 타인을 해치려는 목적으로 검증 가능한 허위 정보 및/또는 콘텐츠를 생성하거나 유포하기 위해
- 개인을 해칠 수 있는 개인 식별 정보를 생성하거나 유포하기 위해
- 타인을 비방, 헐뜯기 또는 괴롭히기 위해
- 개인의 법적 권리를 부정적으로 영향을 미치거나, 구속력 있고 집행 가능한 의무를 생성하거나 수정하는 완전 자동화된 의사결정을 위해
- 온라인 또는 오프라인 사회적 행동 또는 알려진 또는 예측된 개인적 또는 성격적 특성에 기반하여 개인 또는 집단을 차별하거나 해치려는 용도로
- 특정 집단의 나이, 사회적, 신체적 또는 정신적 특성으로 인한 취약점을 착취하여, 해당 집단의 개인의 행동을 명백히 왜곡하여 그 개인 또는 다른 개인에게 신체적 또는 정신적 피해를 발생시키거나 발생시킬 가능성이 있는 경우
- 법적으로 보호된 특성이나 범주에 기반하여 개인 또는 집단을 차별하거나 해치려는 용도로
- 의료 조언 및 의료 결과 해석을 제공하기 위해
- 사법, 법 집행, 이민 또는 망명 절차에 사용될 정보를 생성하거나 유포하기 위해, 예: 사기/범죄 행위를 예측하는 것 (예: 텍스트 프로파일링, 문서 내 주장 간 인과관계 도출, 무차별적 및 임의적 타겟팅 사용 등)
- NFT 생성을 위해

이용 약관

- 본 모델의 비윤리적 사용으로 인해 발생하는 모든 법적 책임은 귀하에게 있습니다.
- 이러한 모델 중 하나를 병합하여 사용하는 경우, 어떤 절차를 통해 병합했는지 명시하고, 수정된 부분을 명확히 표시해야 합니다.

참고

모든 충돌이나 수정 사항이 있으면 알려주세요.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.