Animagine XL V3.1

세부 정보

파일 다운로드

모델 설명

Animagine XL 3.1은 Animagine XL V3 시리즈의 업데이트 버전으로, 이전 버전인 Animagine XL 3.0을 개선한 버전입니다. 이 오픈소스 애니메이션 테마의 텍스트-이미지 모델은 고화질 애니메이션 스타일 이미지를 생성하기 위해 개선되었습니다. 유명 애니메이션 시리즈의 더 넓은 캐릭터 범위, 최적화된 데이터셋, 그리고 더 나은 이미지 생성을 위한 새로운 미적 태그를 포함하고 있습니다. Stable Diffusion XL을 기반으로 구축된 Animagine XL 3.1은 정확하고 상세한 애니메이션 캐릭터 표현을 생성함으로써 애니메이션 팬, 아티스트, 콘텐츠 제작자에게 유용한 자원이 되기를 목표로 합니다.

모델 세부 정보

  • 개발자: Cagliostro Research Lab

  • 협력: SeaArt.ai

  • 모델 유형: 확산 기반 텍스트-이미지 생성 모델

  • 모델 설명: Animagine XL 3.1은 텍스트 프롬프트에서 고품질 애니메이션 이미지를 생성합니다. 손 해부학이 개선되었고, 개념 이해력과 프롬프트 해석 능력이 향상되었습니다.

  • 라이선스: Fair AI Public License 1.0-SD

  • 미세 조정 기반 모델: Animagine XL 3.0

사용 가이드라인

태그 순서

최적의 결과를 얻기 위해, 모델을 이와 같은 방식으로 훈련했기 때문에 구조화된 프롬프트 템플릿을 따르는 것이 권장됩니다:

1girl/1boy, 캐릭터 이름, 어떤 시리즈에서, 나머지는 순서 상관없이.

특수 태그

Animagine XL 3.1은 품질, 등급, 생성 일자 및 미적 요소를 유도하기 위해 특수 태그를 사용합니다. 이 태그 없이도 모델은 이미지를 생성할 수 있지만, 이를 사용하면 더 나은 결과를 얻을 수 있습니다.

품질 조정자

품질 태그는 이제 점수와 후기 평가를 모두 고려하여 균형 잡힌 품질 분포를 보장합니다. 명확성을 높이기 위해 라벨을 개선하였으며, 예를 들어 'high quality'를 'great quality'로 변경했습니다.


품질 조정자	점수 기준
masterpiece	        > 95%
best quality	        > 85% & ≤ 95%
great quality	        > 75% & ≤ 85%
good quality	        > 50% & ≤ 75%
normal quality	        > 25% & ≤ 50%
low quality	        > 10% & ≤ 25%
worst quality	        ≤ 10%

등급 조정자

등급 태그도 단순화하고 명확화하여 다양한 모델에 적용할 수 있는 글로벌 규칙을 수립했습니다. 예를 들어, 'rating: general'은 단순히 'general'로, 'rating: sensitive'는 'sensitive'로 축약되었습니다.


등급 조정자	    등급 기준
safe	            General
sensitive	    Sensitive
nsfw	            Questionable
explicit, nsfw	    Explicit

연도 조정자

결과가 특정한 현대적이거나 고전적인 애니메이션 미술 스타일로 유도되도록 연도 범위를 재정의했습니다. 이 업데이트는 현재 및 과거 시대와의 관련성에 초점을 맞춰 범위를 단순화했습니다.


연도 태그	연도 범위
newest	        2021 ~ 2024
recent	        2018 ~ 2020
mid	        2015 ~ 2017
early	        2011 ~ 2014
oldest	        2005 ~ 2010

미적 태그

우리는 시각적 매력에 기반하여 콘텐츠 분류를 세분화하기 위해 미적 태그를 강화했습니다. 이 태그들은 애니메이션 데이터에 특화된 ViT(Vision Transformer) 이미지 분류 모델의 평가에서 파생되었습니다. 이 목적을 위해 우리는 shadowlilac/aesthetic-shadow-v2 모델을 사용하였으며, 이 모델은 훈련 전 콘텐츠의 미적 가치를 평가합니다. 이를 통해 각 콘텐츠가 단순히 관련성과 정확성뿐만 아니라 시각적으로도 매력적임을 보장합니다.


미적 태그	       점수 범위
very aesthetic	       > 0.71
aesthetic	       > 0.45 & < 0.71
displeasing	       > 0.27 & < 0.45
very displeasing       ≤ 0.27

권장 설정

고미적 이미지를 생성하도록 모델을 유도하려면 다음과 같은 네거티브 프롬프트를 사용하세요:

nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]

더 높은 품질의 결과를 얻으려면 프롬프트 앞에 다음을 추가하세요:

masterpiece, best quality, very aesthetic, absurdres

일반적으로 낮은 클래스 프리 가이던스(CFG Scale) 값을 5-7 정도로 사용하고, 샘플링 스텝은 30 미만으로 설정하며, Euler Ancestral(Euler a) 샘플러를 사용하는 것이 권장됩니다.

멀티 어스펙트 해상도

이 모델은 다음 치수에서 이미지를 생성할 수 있습니다:

치수	        비율
1024 x 1024	1:1 정사각형
1152 x 896	9:7
896 x 1152	7:9
1216 x 832	19:13
832 x 1216	13:19
1344 x 768	7:4 가로
768 x 1344	4:7 세로
1536 x 640	12:5 가로
640 x 1536	5:12 세로

감사 인사

Animagine XL 3.1의 개발과 출시는 다음 개인 및 기관의 귀중한 기여와 지원 없이 불가능했습니다:

  • SeaArt.ai: 협력 파트너이자 스폰서.

  • Shadow Lilac: 미적 분류 모델 aesthetic-shadow-v2 제공.

  • Derrian Distro: LoRA Easy Training Scripts에서 파생된 맞춤 학습률 스케줄러 제공.

  • Kohya SS: 포괄적인 훈련 스크립트 제공.

  • Cagliostrolab 협업자들: 모델 훈련, 프로젝트 관리 및 데이터 관리에 대한 헌신.

  • 초기 테스터들: 유용한 피드백과 품질 보증 노력.

  • NovelAI: 우리의 구현에 영감을 준 미적 태깅의 혁신적 접근.

애니메이션 스타일 이미지 생성의 경계를 확장하는 데 도움을 주신 모든 분들께 진심으로 감사드립니다.

제한 사항

Animagine XL 3.1은 애니메이션 스타일 이미지 생성에 있어 큰 진전을 이룬 모델이지만, 그 제한 사항을 인식하는 것이 중요합니다:

  1. 애니메이션 중심: 이 모델은 애니메이션 스타일 이미지 생성에 특화되어 있으며, 사실적인 사진 생성에는 적합하지 않습니다.

  2. 프롬프트 복잡성: 짧거나 단순한 프롬프트로도 고품질 결과를 기대하는 사용자에게는 적합하지 않을 수 있습니다. 훈련은 미적 정제보다 개념 이해에 초점을 맞췄기 때문에 원하는 출력을 얻기 위해 더 구체적이고 상세한 프롬프트가 필요할 수 있습니다.

  3. 프롬프트 형식: Animagine XL 3.1은 자연어 프롬프트보다 Danbooru 스타일 태그에 최적화되어 있습니다. 최상의 결과를 얻으려면 적절한 태그와 문법을 사용하여 프롬프트를 작성하는 것이 권장됩니다.

  4. 해부학 및 손 표현: 해부학 및 손 표현에서 개선이 있었으나, 여전히 이 영역에서 비최적 결과를 생성할 수 있습니다.

  5. 데이터셋 크기: Animagine XL 3.1의 훈련 데이터셋은 약 87만 장의 이미지로 구성되어 있으며, 이전 버전(120만 장)과 통합하면 총 약 210만 장의 이미지가 됩니다. 이는 상당한 규모이지만, "최종적" 애니메이션 모델로는 여전히 제한적일 수 있습니다.

  6. NSFW 콘텐츠: Animagine XL 3.1은 더 균형 잡힌 NSFW 콘텐츠를 생성하도록 설계되었습니다. 그러나 명시적으로 프롬프트하지 않더라도 모델이 여전히 NSFW 결과를 생성할 수 있음을 인지해야 합니다.

이러한 제한 사항을 인정함으로써, 우리는 Animagine XL 3.1 사용자들에게 투명성을 제공하고 현실적인 기대치를 설정하려 합니다. 이러한 제약에도 불구하고, 이 모델은 애니메이션 스타일 이미지 생성에서 중대한 진보를 이룬 도구이며, 아티스트, 디자이너, 애호가들에게 강력한 도구가 될 수 있다고 믿습니다.

라이선스

Animagine XL 3.0을 기반으로 하는 Animagine XL 3.1은 Fair AI Public License 1.0-SD 라이선스를 따르며, 이 라이선스는 Stable Diffusion 모델의 라이선스와 호환됩니다. 주요 내용:

  1. 변경사항 공유: Animagine XL 3.1을 수정한 경우, 변경 내용과 원본 라이선스를 모두 공유해야 합니다.

  2. 소스 코드 접근: 수정된 버전이 네트워크에 공개되는 경우, 타인이 소스 코드에 접근할 수 있는 방법(예: 다운로드 링크)을 제공해야 합니다. 파생 모델에도 동일하게 적용됩니다.

  3. 배포 조건: 모든 배포는 본 라이선스 또는 유사한 규칙을 가진 라이선스 하에 이루어져야 합니다.

  4. 준수: 준수하지 않는 경우, 라이선스 종료를 방지하기 위해 30일 이내에 수정해야 하며, 투명성과 오픈소스 가치를 강조합니다.

이 라이선스의 선택은 Animagine XL 3.1을 오픈하고 수정 가능하게 유지하여 오픈소스 커뮤니티 정신에 부합하기 위한 것입니다. 기여자와 사용자를 보호하고 협력적이고 윤리적인 오픈소스 커뮤니티를 장려합니다. 이는 모델이 공동의 기여를 통해 이익을 얻을 뿐만 아니라 오픈소스 개발의 자유를 존중하도록 보장합니다.

마지막으로, Cagliostro Lab 공개 서버: https://discord.gg/cqh9tZgbGc

디스코드 서버에 참여해 주세요.
후원하거나 커피 한 잔 사고 싶으신 분은 여기에서 기부해 주세요.

정말 감사합니다 ^_^

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.