SDXL Simulacrum ROSE 512 tokens T5-XL
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
알라카드와 함께 최대 512 토큰 지원
문제가 생기면 어떻게 되나요?
초집중. 이 모델은 특정 주제를 선택해 그 주제에 초집중할 가능성이 높습니다. 어느 시점에서 편향이 일부 요소에 너무 강하게 적용되면서, 시스템은 정확한 활용을 위해 전체 재가중치가 필요하게 되었습니다.
어떻게 사용하나요?
ComfyUI 워크플로우는 비즈니스 여성 이미지에 첨부되어 알라카드가 의도한 방식으로 작동하도록 구성되어 있지만, 가장 간단한 과정은 아닙니다.
이제 모든 이름을 올바르게 지었습니다. 따라서 잘못된 버전을 받으셨다면, 올바른 버전을 확보하세요.
프롬프트 지침
각 버전은 1280x1280 크기 이상, 약 16nnx16nn까지의 해상도에서 활성화되도록 학습되었으며, NSFW 요소는 명시적으로 차단되어야 합니다.
알라카드와 함께 최대 512 토큰을 지원하며, flan-t5-large 또는 XL은 512 토큰으로 설정됩니다. 256 토큰에서 약간 더 안정적이지만, 분명히 512 토큰도 처리할 수 있습니다. bert-beatrix-2048과 결합하면 512를 초월해 최대 2048 토큰까지 컨텍스트 제어가 가능하지만, 이 방법의 출력 결과는 극히 불안정했습니다.
이 모델은 주로 품질을 위한 페온 입력을 전제로 하므로, 다음을 사용할 수 있습니다:
- 점수: score_9, score_8, score_7, score_6, score_5, score_4, score_3, score_2, score_1
- 미적 품질: masterpiece, most aesthetic, very aesthetic, displeasing, very displeasing
- 등급: rating_safe, rating_sensitive, rating_explicit, rating_nsfw
- grid_a1 <- 전체 그리드 지원
- 다양한 요소 시스템을 포함한 평범한 영어 지원
- 다양한 색상, 품질, 결정론적 능력
작동시키기
SIMULACRUM ROSE Epsilon은 세 가지 구성 요소로 이루어져 있습니다:
리파이너 — 이미지 생성의 800-1000단계(즉, 80%에서 100%)를 정교화하기 위한 것.
필요 항목:
- Simulacrum V4 - Epred 전문가 + 클립
이니셜 — 텍스트-이미지 생성을 위한 컨텍스트 강화 및 이미지 완전 리셋을 위한 것.
필요 항목:
- Simulacrum V4 - Epred 전문가 + 클립
풀 — 두 시스템을 병합하고 시스템 전체(0-1000단계)를 완전히 미세 조정한 결합 버전.
필요 항목:
- Simulacrum V4 - Epred 전문가 + 클립
- Alucard
- dev2_electric_boogaloo
- 클립 샘플러 설정됨
- 현재 여러 버전이 존재하므로, 설정된 버전을 사용하세요.
- shiva 폴딩
- 100스텝, 1패스
- flan-t5-large
- bert-beatrix-2048
- Simulacrum Rose T2I - 1.0 강도
- 위 모든 구성 요소가 풀 버전이 정상 작동하도록 필요합니다. 라벨이 잘못 지정되었을 수 있으므로, 출력에 스캔라인이나 이상한 결과가 나타나면 리파이너와 T2I를 교체해 보세요.
학습 과정
각 모델은 약 100 에포크 동안 약 1백만 장의 이미지로 학습되었으며, 문제는 빠르게 나타납니다. 너무 과도하게 학습되어 있어, 제가 이 모델들을 공개하지 못한 이유입니다.
Simulacrum ROSE - Full의 적절한 보간 구현을 얻기 위한 쉬운 방법은 존재하지 않으며, 이를 위해서는 큰 도구셋이 필요합니다. 향후 David가 이 문제를 해결하고 Simulacrum Rose V2와 직접 연동할 예정입니다.
이 모델들은 모두 새로운 스케줄링, 폴딩 및 처리 방식인 ‘알라카드’로 학습되었으며, 이는 표준 노이즈 생성과 함께 조건부를 분리된 버킷으로 구성하는 단계적 방식입니다.
이 시스템은 현재 보간 스펙트럼 내에서 노이즈 유형과 수렴하지 못해 실패했습니다. 이는 편미분 방정식이 잘못되었기 때문이기도 하고, 단계 시스템이 도입한 무작위 드리프트 때문이기도 합니다.
이 모델들은 극도로 과도하게 NSFW 요소를 포함하고 있어 ‘타버린’ 모델이지만, 여전히 여러 용도로 활용 가능하며 매우 강력합니다.
기대와는 크게 달랐습니다.
이 모델을 기다려주신 분들께 깊이 사과드립니다. 오랫동안 미루어 왔고, 결과가 스펙트럼과 호환되지 않았기 때문입니다. 그러나 출력 결과는 여전히 공유되어야 합니다.
토큰 컨텍스트는 예상보다 훨씬 많은 토큰을 유지하며 일관성을 보입니다. 이 모델은 bert-beatrix-2048과 flan-t5-large를 촉매제로 하여 학습되었으며, 표준 클립과 simulacrum-epsilon-v4와 함께 사용할 때 가장 잘 작동합니다.

