AstolfoMix
详情
下载文件
关于此版本
模型描述
AstolfoMix
20个模型的异构融合。详情请见此文。下方内容即将更新,请忽略。
摘要
我推出AstolfoMix,这是一个专注于absurdres的融合模型,同时能不依赖特定艺术风格地生成丰富内容,试图实现偏差-方差权衡。目前它为动漫风格,Astolfo真可爱!
引言
查看HuggingFace模型页面。我时间太少,无法重复其中内容。所有中间模型/变体均已在该页面提供。另可查看此页面获取更多模型。
相关工作
我不确定,“统一融合”是否为原创思路。但我已收集了一些关于融合的信息。未来可尝试auto-MBW-rt的“增强”方法,而非我使用的弱化“袋装”方法。向手动MBW的爱好者致歉,我并无偏好,且“absurdres”从未在相关探索中被涵盖。
方法论
免责声明:这是恶作剧,除非你已理解我所写的内容。此处我不作任何解释。因需独立测试,部分内容可能与实验重复。
计算机科学相关理论
尽量阅读我的文章。若认为这是胡言乱语,请寻求博士生或教授的反馈(或许我会正式写一篇论文)。此外,我仍需时间进行测试并编写Python代码,而这在996生活中几乎不可能完成。
配方
完整配方见此。请记住,使用此工具包替换原始SD的CLIP模型(原始CLIP地址)。整个流程应完全在WebUI中完成,无需一行代码。
实验
艺术作品
详见我的文章、我的艺术作品集及我的常规流程(无手动图像编辑)。关于“相关性”的最后一部分,我“很快”会完成。未使用评分指标,因为已有相关讨论,我更倾向于在尝试将美感与逻辑合理性关联前,先使用基础的区分性指标(参见美学探讨)。就我个人感受而言,它能“以写实比例绘制动漫内容”,这在互联网所有模型中独一无二。
提示词
这是一个基础模型。使用你熟悉的提示词,无需考虑“触发词”。CivitAI中的PNG信息不完整。请参考我的艺术作品。若使用ComfyUI,请忽略提示词权重,或你若不了解其运作方式。仅用“Who What Where”即足够。
采样器
使用你喜欢的即可。我使用默认采样器,因为我简单,而且效果并不差。
CFG / 步数 / 插件
感谢首次评价,任何“默认范围”(CFG 7.5)均可工作(显而易见)。
根据经验,CFG 4.5 或 4.0 将是最低最优值。如有疑虑可绘图验证。可自由使用adetailer进行局部潜在上采样,或使用内置的全局高分辨率修复(1024x1024使用2.0x,768x768使用2.5x,若图像破裂请降低倍率)默认动态CFG(模仿1!遵循论文!),搭配默认FreeU(遵循论文!)。它只是一个基础模型。
嵌入 / LoRAs
感谢首次评价,任何通用嵌入(从NAI/SD或与其“接近”的模型训练而来)均可适用。
请参考此作品和此作品。(它们可能为跨平台转发)。最坏情况下,它将失去高分辨率上采样的能力。此外(可能触发),它支持VBP原生的273种风格嵌入。镜像功能按需激活。
内容与艺术风格的多样性
“是的”。但请记住,它只是一个“优秀”的基础模型。“涵盖大多数内容”。它无法替代嵌入/LoRA或其他工具。你仍需一定的提示技巧来处理次要内容(如非人类、非二元等元素)。
讨论
我认为这并非我的讨论。 请像使用基础模型一样使用我的模型:进一步混合、使用LoRA/微调,一切皆可。我或许能在高分辨率生成上超越多数模型,达到SDXL级别,但我确信这伴随着代价(例如图像层作为“v-pred”,以及“偏差”必须远大于SDXL在1024 ARB训练下直接使用LAION数据集的水平),这已超出我的能力范围。
结论
请试用我的模型!AstolfoMix仅代表我个人的“模型选择”。每个人都可以使用“统一融合”方法,自行创建基础模型,直至更强大的SDXL问世。此外,若你没有充足资源,请勿浪费时间在高风险的MBW/微调上。
附录
使用的模型
应与完整配方一致。




















