Cartunafied

세부 정보

파일 다운로드

모델 설명

  • "거대한 표범의 어깨 위에 앉은 자들처럼, 우리는 거대한 사람들이 찬란하게 세운 기반 위에 서 있어 더 넓고 멀리 보는 것일 뿐이다. 우리 눈이 더 뛰어나거나 더 키가 크기 때문이 아니라, 그들이 우리를 들어 올려주었기 때문이며, 그들의 웅장한 거대함이 우리에게도 함께 더 넓은 시야를 안겨주기 때문이다." - 존 오브 사일러스

  • 이번 공간을 제공해 준 CivitAI와, 끊임없이 완벽함을 향해 나아가는 커뮤니티에게 감사를 전합니다.


V4 요약:

  • 'Tuna v3'를 기반으로 시작해, 병합 블록 가중치(Merged Block Weighting)를 사용하고, 수많은 시행착오를 거쳤습니다. 설정을 신경 쓰는 분들께 사과드립니다만, 만약 제가 설명하려 해도 정확히 설명할 수는 없습니다. 저는 A1111용 SuperMerger 확장 프로그램을 사용했으며, MBW 작동 방식을 배우기 위해 저장 공간을 크게 잡아먹지 않고도 사용할 수 있다면 강력히 추천합니다.

  • UmiAI의 창작자들 및 팀의 모델 믹서가 제공한 조언과 데이터 지원에 감사를 전합니다 (이전 노트에 이미 연결되어 있음). 해당 믹스에 사용된 모델은 이미 링크되거나, 업데이트된 버전이 포함되었으며, 명시적인 허가 하에 사용된 사설 모델들입니다.

  • 어떤 변화가 있었을까? 구성은 더 다이나믹하며, 총체적으로 프롬프트에 더 민감하게 반응합니다. 짧은 문장과 키워드 리스트의 조합을 추천합니다. 특히 부정적인 표현은 지나치게 사용하지 마세요. 손 부분이 다소 개선되었습니다. 눈과 얼굴 세부 정보는 약간 더 스타일리시하고, 더 제한적인 만화처럼 보이는 얼굴 형태를 띱니다. 의류 및 유사한 내부 섹션, 그림자와 조명은 더 높은 수준의 디테일을 갖추고 있습니다. 다양한 표현을 사용할 수 있는 어휘력이 크게 증가했습니다.

  • 스타일링 유연성에 큰 손실 없이, 제 본업인 극도의 공간적 편향성을 충족시켰습니다. 자율적으로 작동할 경우(즉, 특정 프롬프트가 없는 경우), 빛나는 피부의 여성, 일부 노출, 서사적 통합 위주의 와이드한 테스트 선이 강한 서양·동양 만화적 장르의 혼합 스타일을 기본으로 삼습니다.


V3 요약:

  • v3: 아, 나의 영감, 마침내 너를 찾았다. 다양한 피부톤, 인상적인 배경과 디테일, 훨씬 더 신뢰할 수 있는 손, 훨씬 깨끗한 성기 표현. 더 강력하게 프롬프트에 반응하며, v2와 거의 동일한 Loras의 영향력을 받습니다.

  • v2: 더 세부적인 표현 추가, 손과 키워드 반응성 향상, 그러나 Loras의 영향은 적고, 여전히 흰 피부의 알몸 여성에게 취약합니다.

  • fp16 (실제로 v1과 거의 동일): 단순하고 깔끔한 스타일, 디테일은 적고, Loras 등에 매우 민감하게 반응합니다. 기본적인 라인 아트나 2.5D 느낌을 주는 스타일링에 매우 적합합니다. 손 표현은 부족하며, 흰 피부의 알몸 여성 영향이 높습니다.


이 모델은 다양한 비율로 3~8개의 '만화' 스타일 모델을 병합하여 서양 애니메이션 스타일의 풍부함을 얻었으며 동시에 프롬프트와 개념에 매우 민감하게 반응합니다. 다양한 스타일의 프롬프트를 사용하세요 – 다노부루 태그, 문장 조각, 시, 어떤 식이든 자유자재로 이용 가능합니다. 여러 가지 개념을 인식하며, 간단하게도 복잡하게도 사용 가능합니다. 제가 좋아하기 때문입니다. 그리고 여성, 저는 여성들이 좋아요.

  • 이 모델에는 VAE가 내장되어 있지 않습니다. 저는 표준 Stable Diffusion VAE, Clear VAE, 또는 제 자체 Anime VAE를 추천합니다.

  • 이 모델은 소프트코어 NSFW 콘텐츠를 매우 잘 구현할 수 있지만, 하드코어 콘텐츠는 어려움을 겪을 수 있습니다. 필요시 Loras를 사용하세요.

  • 모든 이미지는 단지 프롬프팅만을 통해 생성되었으며, Umi AI라는 고급 와일드카드 확장 기능을 활용했습니다. 추가 확장 기능이나 후처리 기술은 사용되지 않았습니다.

  • '연령에 대한 인식 문제'에 우려를 느끼신다면, 아래 모델을 강력히 추천합니다:
    Squeezer - Experimental
    (단일 LoRA로 양성력은 조정 가능하며, 긍정 스타일은 나이를 낮추고 부정 스타일은 나이를 높입니다. 이는 구성보다는 디테일과 신체 유형에 더 큰 영향을 미칩니다.)
    Age Slider
    (3단계의 나이 조절 Textual Inversion 세트로, 부정 임베딩을 추가 활용할 수 있습니다. 조건부로 추천하는 강도 값이라고 해도, 구성에 혼란스러운 영향을 줄 수 있습니다.)


이 병합 작업에 사용된 모델:


A1111용 Model Toolkit 확장 프로그램을 통해 모델을 검사해 주세요. CLIP 손상 문제를 수리하고 모델을 fp-32 또는 fp-16로 정리할 수 있습니다.


면책 조항
Stable Diffusion 원본 이후 모든 체크포인트와 마찬가지로, 이 모델은 연령 관련 키워드에 민감합니다. 또한 NSFW 콘텐츠를 생성할 수 있습니다. 이 모델을 어떻게 활용할지는 귀하의 선택입니다. 부적절한 이미지를 생성하지 않기 위해 필요한 경우 부정적 프롬프트를 활용하세요. 이 모델은 성인 대상으로 의도되어 있으므로, 이를 고려하여 사용해 주시기 바랍니다.


Tensor.Art에서도 사용 가능: https://tensor.art/models/612849265988992344


v2 요약:

이것은 고급 모델을 추가해 완전히 재작업한 결과물입니다. 추가적인 모델 수정자(LoRAs 등)를 사용하지 않았으며, 보정 없이 프롬프팅만으로 작업했습니다. 이 모델의 본질적인 능력을 보여주기 위해 무작위 프롬프트 구조로 격자형 미리보기(예시)를 제작했습니다. 사용자 편향이 빛나는 피부의 여성과 노출 콘텐츠에 치우져 있어, 모든 종류의 프롬프트에 민감하게 반응합니다 – 짧은 문장, 긴 문장, 키워드 목록, 문장 조각, 어떤 방식이든 자유자재입니다. 특히 NSFW 조건에서는 무엇을 원하는지 명확히 지정해 주세요.


- UmiAI의 와일드카드 시스템을 사용하면 주 프롬프트와 부정 프롬프트 둘 다에 문자열을 호출할 수 있습니다. 별표 ** 사이에 들어가는 항목들은 부정 프롬프트에 포함됩니다. 아래의 예시 그리드를 만들기 위해 사용한 프롬프트와 각 스타일 유형에 사용한 '품질 태그'입니다.

  • <[rngfem]>: "SFW, 1Girl, Adult, ({fat|slutty|cute|muscular} <[rng_intl]>:<[W3.*]>) woman, <[rng_smol]>, (<[rng_hair_multi]>:<[W3.*]>), wearing (<[rng_colors]>:<[W3.*]>) (<[fem_outfit]> outfit:<[W3.*]>), <[rng_gem]> jewelry, <[rng_metal]> accents, glowing {iris|pupils}, <[rng_colors_ext]> eyes, (<[rng_emote]> expression:<[W3.*]>), <[qt_face]>, <[rng_dgrw]>, <[qt_25D]>, <[18+]><[negs_logos]><[negs_body]><[negs_qual]>**naked, nude, **"

  • <[rngxfem]>: "NSFW, 1Girl, Adult, [naked|nude] ({fat|slutty|cute|muscular} <[rng_intl]>:1.2) woman, <[BEWBS]>, <[rng_hair]>, wearing see-through <[rng_colors]> <[fem_outfit]> outfit, <[rng_gem]> jewelry, <[rng_metal]> accents, glowing {iris|pupils}, <[rng_colors]> eyes, <[rng_emote]> expression, <[qt_face]>, <[qt_nsfw]>, <[rng_dg]>, <[18+]>"

  • flat: "flat colors, cel shading, hard shadows, outlines, vector art**realism, photorealistic, hyperrealism, professional photography, uhd, dslr, hdr, ultra high-definition, digital single-lens reflex, high dynamic range, 8k, 3D render**"

  • ani: "depth of field, bokeh, god rays, vivid colors, cinematic hard lighting, smooth shadows"

  • 25d: "subsurface scattering, ray traced, depth of field, bokeh, god rays, vivid colors, cinematic hard lighting, realistic shadows, detailed textures**flat colors, cel shading, hard shadows, vector art, 2D, sketch, background without depth**"

  • photo: "cinematic lighting, depth of field, bokeh, realism, photorealistic, hyperrealism, professional photography, uhd, dslr, hdr**flat colors, cel shading, hard shadows, outlines, vector art, background without depth, 3D render**"


CFG Scale 20-30 설정은 다음 확장 프로그램을 통해 활성화되었습니다: Stable Diffusion Dynamic Thresholding (CFG Scale Fix)


이 병합 작업에 사용된 모델:



vFP16 요약:
이것은 제가 모델을 병합한 처음이자 유일한 시도입니다.
절대 무엇을 하는지 몰라서, 강의를 보고 뭔가를 눌러만 봤습니다. 이 모델은 3~4개의 '만화' 스타일 모델을 병합하여 서양 스타일의 혼합감을 주며 동시에 프롬프트에 매우 민감하게 반응합니다. 진심으로, 프롬프트 가이드 없이도 충분히 잘 작동합니다. 다양한 스타일(포괄적으로 애니메이션 태그나 자연어 문장 조각 포함)에 모두 반응합니다. 이 모델은 대부분의 LoRA 및 부정 임베딩과 잘 작동합니다. 여전히 손 표현과 과도한 사지에 약간의 어려움이 있으나, 전반적으로 출력은 견고합니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.