BeatriXL Huge Liminal V1 SDXL [fp8/bf16/fp32]
详情
下载文件
关于此版本
模型描述
通过在严格的小型临界数据集上使用近50万个样本进行深度微调,将BeatriXL打磨成一个富有艺术性与品味的临界图像生成怪物。
这个工具远不止于生成图像中有趣区域或片段的简单描绘;你能够以多种形态对你的世界进行高级控制。尽管它有时固执难驯,但只要将大多数SDXL模型的LoRA强度设为较低水平,这个怪物便可被驯服。
你不会仅仅得到从列表中复述出的艺术作品。它通常会生成独特的交叉熵污染区域,其结果展现出高复杂性的差异——如果你愿意,这些差异会非常美丽。
Euler或Euler A通常有效,但我建议使用RES4LYF采样器包,以充分展现此模型的强大表现力。
https://huggingface.co/AbstractPhil/Liminal-Full/tree/main/Beatrix-LORA
https://huggingface.co/AbstractPhil/Liminal-Full/tree/main/Beatrix-LORA-V2
你可以自行选择混合方式。它包含几个LoRA,其中一个被合并到核心模型中,随后基于此继续训练最终的LoRA轮次。
liminal, no humans, stuff
该数据集经过长时间、多数据集、多种时间步长的训练。不过请注意,BeatriXL依然相对不稳定——虽然微调大大改善了这一状况,但若你不够谨慎,仍可能看到一些不愿见到的内容。然而,此版本默认比其他版本更安全(SFW),即更倾向于默认生成安全主题而非不安全主题,但不保证绝对安全。
如果你使用人类元素,很可能会看到你不希望看到的内容,因此请谨慎使用。
大约包含5000张不同图像,数量不多。但这些图像均配有从简单英文到详细描述的一系列不同文本标注。
使用了Joycaption 2 + siglip、GPT4o、LLAMA2 LLAVA B-OMEGA + Siglip500、CLIP_L 询问、CLIP_G 询问,以及来自WD14系统的纯原始标签。
课程训练效果极佳。
针对 fp8_e4m3fn
- 如果你的ComfyUI出现重大错误,请在GPU启动批处理文件中添加以下参数:
--fp8_e4m3fn-unet --fp8_e4m3fn-text-enc --fp32-vae
这并非真正的fp8使用,因为ComfyUI并未自动将数据转为fp8,而是手动将其转为了bf16。
model weight dtype torch.float8_e4m3fn, manual cast: torch.float16
但我确实是以float8_e4m3fn作为UNet启动的。对此我实在无从解释,只能说4090显卡可能不支持,仅能在高端显卡上运行。
文本编码器在fp8下运行良好。

很可能是因为代码中运行了"should_use_bf16",这强制将其切换为bf16模式。在找到更优解决方案前,只能升级为bf16,但至少模型体积很小。




















