Animagine XL 4.0

세부 정보

파일 다운로드

모델 설명

프롬프트 작성에 대한 자세한 가이드라인은 Cagliostrolab 블로그에서 읽어주세요.

개요

Animagine XL 4.0(또는 Anim4gine로 표기)은 최고의 애니메이션 테마 세부 조정된 SDXL 모델이며, Animagine XL 시리즈의 최신 버전입니다. 이전 버전의 연장선이지만, 이 모델은 2025년 1월 7일 기준으로 다양한 출처에서 수집된 840만 개의 다채로운 애니메이션 스타일 이미지 대규모 데이터셋을 사용하여 Stable Diffusion XL 1.0에서 재학습되었으며, 약 2650 GPU 시간 동안 세부 조정되었습니다. 이전 버전과 마찬가지로, 이 모델은 신원 및 스타일 학습을 위해 태그 순서 지정 방법을 사용하여 학습되었습니다.

**Animagine XL 4.0 Opt(최적화 버전)**의 출시로, 추가 데이터셋을 통해 안정성, 해부학 정확성, 노이즈 감소, 색상 채도, 전체 색상 정확성이 개선되었습니다. 이러한 향상은 시리즈의 고유한 품질을 유지하면서 Animagine XL 4.0 Opt를 더욱 일관되게 그리고 시각적으로 매력적으로 만듭니다.

변경 사항

- 2025-02-13 – Animagine XL 4.0 Opt 및 Animagine XL 4.0 Zero 추가

  • 더 일관된 출력을 위한 향상된 안정성
  • 정확한 비율로 개선된 해부학 구조
  • 생성 시 노이즈 및 아티팩트 감소
  • 저채도 문제 해결로 풍부한 색상 구현
  • 보다 시각적으로 매력적인 결과를 위한 색상 정확성 향상

- 2025-01-24 – 초기 릴리즈

모델 세부 정보

사용 가이드라인

프롬프트 가이드라인은 아래 이미지에서 요약할 수 있습니다.

1. 프롬프트 구조

이 모델은 태그 기반 캡션과 태그 순서 지정 방법으로 학습되었습니다. 다음 구조화된 템플릿을 사용하세요:

1girl/1boy/1other, 캐릭터 이름, 소속 시리즈, 등급, 나머지 항목은 순서 상관없이 기재하고 품질 향상 태그로 끝내세요

2. 품질 향상 태그

프롬프트 마지막에 다음 태그를 추가하세요:

masterpiece, high score, great score, absurdres

3. 추천 네거티브 프롬프트

lowres, bad anatomy, bad hands, text, error, missing finger, extra digits, fewer digits, cropped, worst quality, low quality, low score, bad score, average score, signature, watermark, username, blurry

4. 최적 설정

  • CFG Scale: 4–7 (추천값: 5)
  • 샘플링 단계: 25–28 (추천값: 28)
  • 추천 샘플러: Euler Ancestral (Euler a)

5. 추천 해상도

6. 최종 프롬프트 예시

1girl, firefly \(honkai: star rail\), honkai \(series\), honkai: star rail, safe, casual, solo, looking at viewer, outdoors, smile, reaching towards viewer, night, masterpiece, high score, great score, absurdres

특수 태그

이 모델은 이미지 생성 과정의 다양한 측면을 제어할 수 있도록 여러 특수 태그를 지원합니다. 이 태그들은 다양한 프롬프트에서 일관된 결과를 얻기 위해 신중하게 가중치를 부여하고 테스트되었습니다.

품질 태그

품질 태그는 전체 이미지 품질과 디테일 수준에 직접적인 영향을 미치는 기본 제어 요소입니다. 사용 가능한 품질 태그:

  • masterpiece
  • best quality
  • low quality
  • worst quality

점수 태그

점수 태그는 기본 품질 태그보다 더 정교한 이미지 품질 제어를 제공하며, 이 모델에서는 출력 품질 조정에 더 큰 영향을 미칩니다. 사용 가능한 점수 태그:

  • high score
  • great score
  • good score
  • average score
  • bad score
  • low score

시대 태그

시대 태그는 특정 시기 또는 연도에 따른 예술적 스타일을 조절할 수 있도록 도와줍니다. 특정 시대의 예술적 특징을 가진 이미지를 생성하는 데 유용합니다. 지원되는 연도 태그:

  • year 2005
  • year {n}
  • year 2025

등급 태그

등급 태그는 생성된 이미지의 콘텐츠 안전 수준을 제어하는 데 도움을 줍니다. 이 태그는 적절한 법적 요구사항 및 플랫폼 정책에 따라 책임 있게 사용되어야 합니다. 지원되는 등급:

  • safe
  • sensitive
  • nsfw
  • explicit

학습 정보

이 모델은 최고의 하드웨어와 최적화된 하이퍼파라미터를 사용하여 최고 품질의 출력을 보장하도록 학습되었습니다. 아래는 학습 과정에서 사용된 상세한 기술 사양 및 파라미터입니다.

감사의 말

이 장기 프로젝트는 Stability AI, Novel AI, Waifu Diffusion 팀이 제공한 혁신적인 작업, 기여 및 종합적인 문서 없이 불가능했습니다. 특히 V2 이후 진행을 가능하게 해준 Main의 크라우드펀딩 지원에 진심으로 감사드립니다. 이번 버전에 대해서는 커뮤니티 구성원 여러분의 지속적인 지원에 진심으로 감사드리며, 다음 분들께 특별히 감사의 뜻을 전합니다:

  1. Moescape AI: 모델 배포 및 테스트에 있어 귀중한 협력 파트너
  2. Lesser Rabbit: 필수 컴퓨팅 및 연구 자금 제공
  3. Kohya SS: 포괄적인 오픈소스 학습 프레임워크 개발
  4. discus0434: 업계 최고의 오픈소스 Aesthetic Predictor 2.5 개발
  5. 초기 테스터: 귀중한 피드백과 철저한 품질 보증을 위한 헌신

기여자

이 프로젝트에 크게 기여한 팀원들에게 진심 어린 감사를 전합니다. 그 중 일부는 다음과 같습니다:

모델

Gradio

관계, 재정 및 품질 보증

데이터

자금 모금이 다시 시작되었습니다!

학습, 연구 및 모델 개발을 지원하기 위해 GitHub Sponsors를 통한 새로운 자금 모금 방법을 도입하게 되어 기쁩니다. 여러분의 지원은 AI가 가능하게 할 수 있는 영역의 경계를 확장하는 데 도움이 됩니다.

다음과 같이 도와주실 수 있습니다:

  • 기부: 아래 주소로 ETH 또는 USDT로 기부해 주세요.
  • 공유: 우리의 모델을 널리 알리고, 자신이 만든 작품을 공유해 주세요!
  • 피드백: 어떻게 개선할 수 있을지 알려주세요.

기부 주소:

ETH/USDT/USDC(e): 0xd8A1dA94BA7E6feCe8CfEacc1327f498fCcBFC0C

GitHub 스폰서: https://github.com/sponsors/cagliostrolab/

왜 암호화폐를 사용합니까?
초기에 Ko-fi와 PayPal을 기부 수단으로 사용했을 때, 프로젝트의 목적을 설명해도 PayPal 계정이 차단되어 결국 사용이 금지되었습니다. 이로 인해 모든 기부금을 환불해야 했고, 신뢰할 수 있는 지원 수단을 잃게 되었습니다. 이러한 문제를 방지하고 투명성을 보장하기 위해, 이제 자금 모금은 암호화폐를 사용하고 있습니다.

암호화폐가 아닌 통화로 기부하고 싶으신가요?
PayPal에서 불쾌한 경험을 했지만, 암호화폐 대신 다른 방식으로 지원하고 싶으시다면, Discord 서버를 통해 연락주세요.

Discord 서버에 가입하세요

자유롭게 저희 Discord 서버에 가입하세요: https://discord.gg/cqh9tZgbGc

한계 사항

  • 프롬프트 형식: 태그 기반 텍스트 프롬프트만 지원하며, 자연어 입력은 효과적이지 않을 수 있습니다.
  • 해부학: 손의 자세나 손가락 개수 등 복잡한 해부학적 세부 사항에서 어려움을 겪을 수 있습니다.
  • 텍스트 생성: 이미지 내 텍스트 렌더링은 현재 지원되지 않으며, 권장하지 않습니다.
  • 새로운 캐릭터: 학습 데이터 부족으로 최근 캐릭터는 정확도가 낮을 수 있습니다.
  • 다중 캐릭터: 다중 캐릭터 장면은 신중한 프롬프트 설계가 필요할 수 있습니다.
  • 해상도: 더 높은 해상도(예: 1536x1536)에서는 학습에 사용된 원본 SDXL 해상도로 인해 품질 저하가 나타날 수 있습니다.
  • 스타일 일관성: 학습은 스타일 일관성보다 정체성 보존에 더 초점이 맞춰져 있어, 특정 스타일 태그가 필요할 수 있습니다.

라이선스

이 모델은 Stability AI의 원본 CreativeML Open RAIL++-M 라이선스를 수정 없이 그대로 채택합니다. 라이선스 조건은 원본 SDXL 라이선스에 명시된 내용과 동일합니다.

  • 허용됨: 상업적 사용, 수정, 배포, 개인적 사용
  • 금지됨: 불법 활동, 해로운 콘텐츠 생성, 차별, 착취
  • ⚠️ 요구사항: 라이선스 복사본 포함, 변경 사항 명시, 공지사항 유지
  • 📝 보증: "있는 그대로" 제공되며, 보증 없음

완전하고 공식적인 조건 및 조항은 원본 SDXL 라이선스를 참조하세요.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.