BeatriXL Huge Liminal V1 SDXL [fp8/bf16/fp32]
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
약 50만 개의 샘플을 사용하여 엄격히 더 작은 리미널 데이터셋에 대해 강력한 미세 조정을 수행해, BeatriXL을 예술적이고 세련된 리미널 이미지 생성 머신으로 완성했습니다.
이 도구는 단순히 이미지의 흥미로운 영역이나 영역을 묘사하는 것을 넘어서, 다양한 형태로 세계에 고도로 정교한 제어를 제공합니다. 가끔은 고집스럽지만, 이 거대한 존재는 다스릴 수 있습니다. 대부분의 SDXL 모델에서 LoRA 강도를 낮게 설정하면, 대부분의 LoRA와 호환됩니다.
이 모델은 단순히 목록에서 재생산된 예술을 제공하지 않습니다. 그 대신 종종 독특한 교차 엔트로피 오염 영역을 생성하며, 결과는 높은 복잡성 차이를 반영합니다. 원한다면 아름다운 차이들입니다.
Euler 또는 Euler A가 보통 잘 작동하지만, 이 모델의 장점을 극대화하려면 RES4LYF 샘플러 팩을 사용하는 것을 권장합니다.
https://huggingface.co/AbstractPhil/Liminal-Full/tree/main/Beatrix-LORA
https://huggingface.co/AbstractPhil/Liminal-Full/tree/main/Beatrix-LORA-V2
원하신다면 직접 혼합을 선택하실 수 있습니다. 몇 개의 LoRA가 있으며, 하나는 코어에 병합된 후, 최종 LoRA 에포크가 그 기반에서 학습되었습니다.
liminal, no humans, stuff
데이터셋은 긴 시간 동안 여러 데이터셋과 다양한 타임스텝으로 학습되었습니다. 하지만 주의하세요, BeatriXL은 여전히 상당히 불안정합니다. 정제는 매우 큰 도움이 되지만, 주의하지 않으면 원치 않는 결과를 볼 수 있습니다. 그러나 이 버전은 다른 버전들에 비해 기본적으로 훨씬 더 SFW입니다. 즉, NSFW 주제보다 SFW 주제로 기본 설정될 가능성이 높지만, 보장은 없습니다.
인간을 사용하면 원치 않는 결과를 볼 가능성이 높으므로 주의하세요.
약 5,000개의 서로 다른 이미지로, 많지는 않습니다. 그러나 이 5,000개의 이미지에는 단순한 영어 문장에서 완전한 설명에 이르기까지 다양한 캡션 시리즈가 부여되었습니다.
Joycaption 2 + siglip, GPT4o, LLAMA2 LLAVA B-OMEGA + Siglip500, CLIP_L 인터로게이션, CLIP_G 인터로게이션, 그리고 WD14 시스템에서 직접 추출한 원시 태그들입니다.
커리큘럼 학습은 매우 잘 진행되었습니다.
fp8_e4m3fn용
- ComfyUI에서 큰 오류가 발생하면 GPU 실행 bat 파일에 다음을 추가하세요:
--fp8_e4m3fn-unet --fp8_e4m3fn-text-enc --fp32-vae
이것은 진정한 fp8 활용이 아닙니다. ComfyUI는 fp8로 자동 캐스팅하지 않고, 대신 저에게 수동으로 bf16로 캐스팅했습니다.
model weight dtype torch.float8_e4m3fn, manual cast: torch.float16
그러나 저는 확실히 unet에 float8_e4m3fn으로 시작했습니다. 이건 아마도 4090에서 제대로 지원되지 않아 더 고사양 카드에서만 실행될 것입니다.
텍스트 인코더는 fp8에서 잘 작동합니다.
이 코드 내에서 "should_use_bf16"가 실행되므로 아마도 bf16 모드로 강제 전환된 것으로 보입니다. 적절한 해결책을 찾을 때까지 bf16으로 업스케일링해야 하지만, 최소한 크기는 작습니다.




















