SDXL-base에 180만 장의 애니메이션 이미지 데이터셋으로 학습된 애니메이션 베이스 모델. 귀엽고 스마트하며 유연하며, 당신의 것입니다!

네, 이것은 새로운 SDXL 애니메이션 베이스 모델입니다.

해부학 측면에서 다른 모든 비폰 애니메이션 모델을 능가합니다.
일반 지식과 SFW 측면에서 폰과 NAI3를 능가합니다.
8,000개 이상의 아티스트 스타일 (와일드카드) — 기본적으로 몇 가지 일반 스타일 제공
전체 색상 팔레트, 전체 밝기 범위, 뛰어난 기본 미적 감각
원래 SDXL의 지식을 그대로 유지, 뇌 절단 없음
아마도 당신이 오랫동안 찾던 독특한 경험

저는 일부 GPU 시간과 양질의 데이터셋을 확보했기 때문에, SFW/NSFW 애니메이션 개념에 대한 광범위한 지식을 가지면서도, 이전 폰 등에서 보았던 것처럼 SDXL에서 모든 것을 뇌 절단하지 않는 애니메이션 모델을 학습할 수 있을지 궁금했습니다. 이 체크포인트는 실제로 그 답이며 개념 증명입니다. 여전히 매우 실험적이며 많은 부분을 보완하거나 수정해야 하지만, 이미 사용 가능하며 여러 면에서 우수하며 오픈소스 체크포인트에서 누락된 기능들을 갖추고 있습니다.

Tofu는 4th tail과 거의 동일한 데이터셋을 사용하여 인기 캐릭터를 생성하고 아티스트 스타일을 모방하며 대부분의 보루 태그와 개념을 인식할 수 있습니다. 자연 텍스트 혼합 캡션과 독특한 학습 기법 역시 동일하게 적용되었습니다.

손가락 같은 작은 디테일이 훌륭합니다. 배경에는 SDXL-base에서 유래한 인기 있는 실제 장소나 아름다운 풍경/도시 풍경이 사용 가능합니다.
포즈와 NSFW는 괜찮습니다. 폰처럼 완벽하진 않지만, 베이니 폰과 비교하면 훨씬 나쁘지 않습니다. 다만 최고의 PD 튜닝/믹스보다는 떨어집니다. 그래도 Tofu는 다른 모든 모델을 능가하며 대부분의 요구를 충족시킬 것입니다. 더 매운 것을 원한다면 4th tail을 사용하세요. 전환은 거의 매끄럽습니다.
스타일은 폰 베이스보다 잘 나오며, TE의 손상이나 충돌이 없습니다.
네, 텍스트 생성이 가능하지만 성능이 매우 낮습니다. SD3/FLUX와 비교할 수 없으며, SDXL-base와 마찬가지로요. 그래도 뭔가라도 됩니다.
대부분의 SDXL LoRA와 일부 Animagine/기타 체크포인트 LoRA와 호환되지만, 다양합니다. 폰에서 온 LoRA는 전혀 사용 불가능하며, 일부 스타일 또는 개념 LoRA는 작동할 수 있으나 성능은 불확실합니다. 가장 중요한 것은 SDXL의 ControlNet이 잘 작동합니다. Anytest(접미사 AM, PD 아님)도 괜찮은 결과를 줍니다.

기능 및 프롬프트:

기본:

모든 SDXL과 동일, txt2img은 약 1 메가픽셀, 64의 배수인 해상도(1024x1024, 1152x, 1216x832 등)로 임의의 비율 사용. Euler_a 및 CFG 4~~9(최적: 6~~7). 고해상도 보정: anyGAN/DAT, 1.5~1.6배, 노이즈 제거: 0.5, 단일 타일 해상도가 3MPX를 초과하지 않도록 할 때 업스케일이 가장 효과적입니다. 고해상도 보정과 추가 업스케일은 품질, 디테일, 눈, 손, 발 등을 획기적으로 향상시킵니다.

생성 도구 설정에서 _강조: 노름 없음_으로 설정하세요. 이상한 덩어리나 왜곡이 발생할 경우.
LCM/PCM 가속기를 적용한 경우 Euler/Euler a 샘플러를 사용하세요. DDIM은 많은 혼란과 괴상한 결과를 초래합니다.

Clip Skip은 사용하지 마세요. 이 멤은 잊어버리세요.

fp16-fix 같은 외부 SDXL VAE를 사용하세요. 모델에 내장된 VAE는 오래되었을 수 있습니다.

품질 분류:

masterpiece, best quality

긍정적 프롬프트에 사용

low quality, worst quality

부정적 프롬프트에 사용. 이뿐입니다.

score_x, source_x 등과 같은 쓸데없는 것들은 절대 사용하지 마세요. 프롬프트에 넣으면 단순히 텍스트가 그림 위에 뜨는 결과만 나옵니다.

부정적 프롬프트:

(worst quality, low quality:1.1), error, bad hands, watermark, distorted

자신의 선호에 맞게 조정하되, 가능한 한 깔끔하게 유지하세요.

회색조, 단색, 노란 배경 같은 태그를 부정적 프롬프트에 넣지 마세요. 이건 폰이 아니며, 과포화된 타박된 이미지만 나옵니다.

배경을 개선하려면 부정적 프롬프트에 추가하세요:

simple background, blurry background, abstract background

그러나 단순한 배경을 원할 때는 반드시 제거하세요.

아티스트 스타일:

예시 그리드

"by "와 함께 사용하면 매우 흥미로운 결과를 얻을 수 있으며, 프롬프트 가중치로 제어 가능합니다.

by ARTISTNAME1, [by ARTISTNAME2, (by ARTISTNAME3:0.8),...]

또는

[by ARTISTNAME1|by ARTISTNAME2|by ARTISTNAME3|...]

프롬프트 시작부분에서 가장 효과적입니다. 와일드카드로도 사용 가능합니다. 대부분의 경우 고해상도 보정/업스케일이 품질과 인식도를 크게 향상시킵니다.

일반 스타일:

2.5d, bold line, smooth shading, flat colors, minimalistic, cgi, digital painting, ink style, oil style, pastel style

결합 사용 가능(아티스트와도), 가중치 적용, 긍정/부정 프롬프트 모두 가능. 향후 추가 예정.

자연 텍스트:

보루 태그와 결합하여 사용하면 매우 잘 작동합니다. 스타일과 품질 태그를 입력한 후에만 자연 텍스트를 사용하세요. 보루 태그만으로도 충분하며, 원하는 대로 사용하세요.

폰과 달리, 여기서는 현실 개념, 자동차, 기계, 기타 참조 등이 더 잘 작동합니다. 하지만 FLUX처럼 정교하진 않으며, 크기와 구조가 비교 불가합니다.

꼬리/귀 관련 개념:

작동은 합니다만, 기대만큼 좋지는 않습니다.

tail censor, holding own tail, hugging own tail, holding another's tail, tail grab, tail raised, tail down, ears down, hand on own ear, tail around own leg, tail around penis, tail through clothes, tail under clothes, lifted by tail, tail biting, ...

밝기/대비:

원하는 내용을 태그나 자연 텍스트로 프롬프트하면 잘 작동합니다. 예: 어두운 밤, 황혼, 밝은 햇빛 등. 검정/흰색 배경도 작동하지만, 보통 0,0,0 또는 255,255,255처럼 정확하지는 않습니다. 대부분 이는 프롬프트와 관련이 있으므로, 보루에 해당 태그가 달린 이미지를 확인하세요.

다행히 "(완전히 검은 배경 앞에 귀여운 소녀)" 같은 자연어 구문으로 해결됩니다. 일반 사용에서는 별다른 문제가 없으며, NAI3와 비슷하거나 종종 더 나은 성능을 보입니다.

알려진 문제:

복잡한 포즈 및 장면에서 어려움, 더 많은 학습 필요
편향이 존재할 수 있음
Ciloranko는 사실 오소리입니다. LMAO (선별된 데이터셋 중 하나의 오류)
발견 중, 작업 중, 매우 실험적, 최초의 사례 등

향후 모델을 위한 아티스트/캐릭터 요청은 열려 있습니다. 약한 성능, 부정확하거나 강한 워터마크가 있는 아티스트/캐릭터/개념을 발견하면 알려주세요. 명시적으로 추가하겠습니다. 새 버전을 주시하세요.

피드백을 남겨주세요. 매우 소중하고 중요합니다.

라이선스:

헤 헤~

감사의 말:

개인 작품을 공유해 주신 아티스트들은 익명을 원합니다; Soviet Cat - GPU 후원; Sv1. - LLM 접근, 캡션, 코드; K. - 학습 코드; Bakariso - 데이터셋, 테스트, 조언, 내부 정보; NeuroSenko - 기부, 테스트, 코드; dga, Fi., ello - 기부; 도와준 다른 동료들. 정말 사랑합니다 ❤️.

물론 피드백과 요청을 보내주신 모든 분들께도 감사드립니다. 정말 소중합니다.

기부

AI는 제 취미이며, 저는 돈을 쓰고 있고 기부를 요구하지는 않습니다. 지원하고 싶다면 제 모델을 공유하고, 피드백을 남기고, 케모노미미 소녀가 있는 귀여운 그림을 만들어주세요. 물론 원래 아티스트들을 지원해 주세요.

하지만 기부금은 더 나은 학습과 연구를 가속화합니다.

(단, 제가 술이나 코스프레 소녀에게 돈을 쓸 수도 있다는 점을 기억하세요)

BTC: bc1qwv83ggq8rvv07uk6dv4njs0j3yygj3aax4wg6c

ETH/USDT(e): 0x04C8a749F49aE8a56CB84cF0C99CD9E92eDB17db

GPU 시간(a100+ 이상)을 제공할 수 있다면 PM 주세요.

모델 유형	체크포인트
기본 모델	SDXL 1.0
게시일	9/10/2024

Tofu [ANIME BASE MODEL]

세부 정보

파일 다운로드

이 버전에 대해

모델 설명