OmniA - Multi Concept Model

详情

下载文件

模型描述

单击此处: 下载完整文档以解锁全部功能

单击此处了解: 授权、可用性及使用条款
ComfyUI: 教程与工作流nuaion 提供

OmniA® v1.0:全面技术概述与深度使用指南

引言与核心理念

OmniA® v1.0 是一款先进的文本到图像生成模型,被设计为一个灵活且强大的基础框架。其核心设计理念强调用户控制、多样艺术风格下的高保真输出,以及摆脱复杂提示范式(如强制性的“评分标签”)。作为独立开发的专用模型,OmniA® 专为后续微调及衍生模型(例如 LoRAs、Embeddings)的创建而优化,为训练者提供更具适应性与风格丰富性的起点。本摘要详述了该模型的主要特性、最佳生成参数及掌控其强大能力的高级技巧。


  1. 先进的多风格条件系统

OmniA® 最显著的特征是其精密的风格控制体系,该体系通过显式关键词与内在风格推断相结合实现。

这些关键词可直接、精确地控制输出风格。每个关键词均在数据集中经过精心筛选的子集训练,以唤起特定的美学效果。

4n1m3rg3 — 用于写实与半写实风格:
此关键词引导 OmniA® 生成具有摄影质感的输出。它强调合理的光影、精细的纹理、材质定义与准确的人体结构。半写实输出保留上述特性,但可能带有风格化修饰,类似高质量数字绘画。

4n1v3rs3 — 用于 2.5D 插画风格:
此关键词可生成具有强烈空间深度与立体感的风格,常类似于概念艺术或风格化游戏图形。输出保留插画、绘画或数字渲染的美学,而非写实风格。

4n1t00n — 用于动漫风格生成:
此关键词生成符合日本动画的视觉特征,包括赛璐珞着色、鲜明且富有表现力的面部特征、动态构图和鲜艳的色彩搭配。

4n1m1cs 和/或西方漫画 — 用于美式漫画风格:
此关键词组合可生成多种漫画艺术风格,从经典超级英雄美学(粗重轮廓线与本戴点)到现代图画小说风格(精致着色与强烈对比)。

动画风格: 也可有限度地使用更宽泛的标签,但结果未必完美。(例如使用“Pixar”、“迪士尼”等术语):提及特定动画工作室或极具影响力作品(如《龙珠》、《海贼王》)的关键词可用于唤起其独特的视觉语言。

内在风格推断: 关键词的使用并非强制。OmniA® 设计为仅凭描述性文本即可有效推断所需的视觉风格。例如提示词“夜晚的赛博朋克城市,下雨,霓虹灯牌”将自然生成符合语境的风格图像,无需显式关键词。


  • 风格权重与混合: 可使用语法 (关键词:权重) 为关键词分配数值权重,以调节其影响。这允许在单次生成中实现细腻的艺术风格混合。

    • 示例: 提示词中包含 (4n1t00n:1.8) 和 (4n1m3rg3:0.0),可生成具有清晰动漫线条(因 4n1t00n 权重较高)但服装带有半写实纹理(因 4n1m3rg3 权重较低)的角色。


  • 风格否定: 风格关键词在负面提示中极为有效,可用于引导生成远离特定风格。若用户希望生成写实肖像,但出现漫画或卡通风格痕迹,可在负面提示中加入 4n1m1cs 或 “Anime Style” 来抑制这些元素。


  1. 优化生成参数与采样器选择

要获得 OmniA® 的最佳效果,需理解核心参数与采样器如何与模型交互。

采样器的选择直接影响最终图像的美学、细节与创意变化。

强烈推荐默认值: DPM++ 2M Karras 或 DPM++ 2M SGM Uniform。这些采样器在速度、细节与稳定收敛之间提供了出色的通用平衡,通常生成锐利、高质量的图像,是大多数生成任务的推荐起点。

用于创意探索: Euler Max。此采样器更具创意性,即使使用相同种子也能产生更多样化结果,适合探索与艺术创作,有时在较少步数(如 30 步)下即可获得良好效果。

快速替代方案: DDIM 或 UniPC。这些采样器更快,但在低步数下可能缺少 Karras 后缀 DPM 采样器所具备的精细细节或纹理丰富度。

实验性方法: 强烈建议进行实验,因不同采样器与特定提示类型和期望美学的交互方式各异。

CFG Scale(无分类器引导):

  • 推荐范围: 2.0 至 9.0。

  • 低值(2.0–5.0): 产生更写实、更具创意自由度的结果,对提示的忠实度较低。适用于抽象或实验性创作。

  • 中值(5.0–7.0): OmniA® 的提示忠实度与图像质量的最佳平衡点。大多数用户在此范围内可获得极佳效果。

  • 高值(7.0–9.0): 增强提示忠实度,适用于精确输出,但若过度提升可能导致色彩过饱和或产生轻微伪影。

采样步数:

  • 推荐范围: 25 至 60 步。

  • 基准: 对于常见采样器,30–40 步是大多数生成任务的良好起点。

  • 增加细节: 对于高度复杂的提示,提升至 40–50 步可能有益。对大多数采样器而言,超过 60 步后收益显著递减。

分辨率与宽高比:

  • 横版/竖版: 1344x768 像素(或 768x1344)。

  • 方版: 1280x1280 像素。

  • 建议遵守这些分辨率,以确保模型按训练状态运行,最小化变形与构图问题。

aDetailer 设置:

  • aDetailer 插件在精细处理面部细节(尤其在 40 步以上)时表现优异。但其显著缺陷是:它倾向于统一化面部特征。如需在不同生成中获得更丰富的面部多样性,建议禁用该插件。

高级问题解决技巧

本节提供具体、已验证的策略,用于应对常见挑战并释放 OmniA® 的全部潜力。

在使用 4n1m3rg3 关键词时,观察到类似过训练的现象:写实风格可能过度主导。对此有两种有效解决方案。

方法一:逐步降低权重:
最直接的方法是在正向提示中降低该关键词的权重。不使用默认的 4n1m3rg3(权重 1.0),而是逐步下调数值以找到理想平衡。

  • 用法: 从 (4n1m3rg3:1.0) 逐步过渡至 (4n1m3rg3:0.9)、...0.5、...0.1,甚至极低值如 (4n1m3rg3:0.001),以实现精细控制。此法保留写实风格优势,同时减轻其过度应用。

方法二:双提示权重法:
此高级方案同时在正向与负向提示中使用该关键词。

  • 正向提示: 使用较低的固定值,例如 (4n1m3rg3:0.10),确保风格存在但不过于强势。

  • 负向提示: 同时使用反向权重,例如 (4n1m3rg3:0.35)。此举主动对抗其他强烈风格(如动漫),帮助图像趋向更均衡的写实效果。

  • 注意: 此方法在使用 DPM++ 2M SDE 或 DPM++ 3M SDE 采样器且至少 35 步时最为有效。


  1. 天啊!又一个生成相同面孔的模型?

为避免模型生成千篇一律的面孔,OmniA® 采用特定提示策略。

诀窍: 不要使用影响面部轮廓的特定标签 4n1m3rg3

方法: 让 OmniA® 从提示的整体语境中推断面部结构(例如:“写实照片,牛仔镜头,女性,简单背景”)。结合基础负向提示排除不想要的风格与伪影(例如:动漫、卡通、插画、CGI、绘画、面纱、痣、涂绘脸)。此方法利用模型的灵活性,生成多样化的独特面孔。


  1. 超快生成

OmniA® 经优化实现卓越效率,可在远少于许多当代模型的步数内生成高质量图像。

能力: 仅用 10 步采样 即可生成引人注目的图像。

配置: 此效果已通过 DPM AdaptiveDPM++ 2M(搭配 Karras 调度器) 采样器,结合 CFG Scale 设置在 2.0 至 3.0 的范围验证。此狭窄 CFG 范围有效,源于模型本身强大的提示契合能力,即使在低引导强度下仍可实现有效引导。


  1. ComfyUI 与 OmniA©

我们衷心感谢 nuaion 在 OmniA© 项目上所做出的卓越工作与长期协作。其创意思维与奉献精神对 OmniA© 的诞生及其能力超越预期起到了至关重要的作用。

nuaion 慷慨分享其专业知识,制作了一套极为详尽的教程。该指南包含多种工作流,明确展示如何通过 ComfyUI 界面 最大化 OmniA© 的表现。这充分体现了其对模型的深刻理解与创新精神。

nuaion 在协助我们构建与发展 OmniA© 上投入的时间与精力弥足珍贵,我们对此深表感激。

如需解锁 OmniA© 的全部潜力,我们强烈推荐访问 nuaion 的网站https://omnia.nuaion.com,在那里您将找到完整的教程。


  1. 促进协作:OmniA® 的未来

OmniA® v1.0 的开发标志着生成式图像 AI 的重要里程碑,提供了一个以适应性与控制为核心、功能强大的多风格基础模型。然而,我们坚信,OmniA® 的真正潜力与持续演进,掌握在更广泛的 AI 社区手中,尤其依赖于专注的模型训练者。

OmnIA® 经过精心设计,作为基础模型,专门满足寻求灵活且稳健基础以打造自定义创作的训练者的需求。我们真诚希望,OmniA® 能成为开发高度专业化 LoRAs、Embeddings 以及全新衍生模型的首选起点。这些由才华横溢的训练者精心打造的重要补充,将进一步扩展 OmnIA® 的能力,实现前所未有的艺术表达与主题聚焦。

为突出我们对协作与赋能的承诺,OmniA® 的许可协议(CreativeML Open RAIL++-M - 修改版)经过慎重选择。此许可证专门设计,赋予训练者对其衍生作品的完全控制权与自由,确保他们的宝贵贡献真正属于自己。 我们期待构建一个充满活力的生态系统,训练者可以自信地基于 OmnIA® 进行创新,分享其成果,并推动可能性的边界。

OmniA® 2.0 及后续版本的未来发展,完全依赖于整个社区的集体努力与热情反馈。我们诚挚邀请所有训练者探索 OmniA®,创建属于自己的独特 LoRAs、Embeddings 和衍生模型,并分享你们的发现。你们的反馈、见解与共同创作,将直接塑造 OmniA® 的发展方向,使其成为全球艺术家与创作者更强大、更灵活的工具。


社区协作:使用我们的标志推广 OmnIA®

我们致力于围绕 OmniA® 建立一个强大且协作的社区。如果您欣赏我们模型的功能,并希望帮助我们扩大其影响力与认知度,我们诚挚邀请您在衍生作品中展示 OmniA® 标志。

通过在您基于 OmniA® 开发的自定义模型、LoRAs 或 Embeddings 的封面图像或宣传材料中加入官方 OmniA® 标志(PSD 或 PNG)*,您不仅认可了其基础性作用,也显著提升了生成式 AI 生态系统中的整体认知度。这种支持对我们及未来 OmniA® 版本的持续发展至关重要。

*如您没有图形软件编辑 PSD 文件,我们推荐使用免费在线工具 Photopea

我们相信,真正的创新源于共享努力,您在推广 OmnIA® 方面的贡献,将帮助强化整个基于它的社区。感谢您的支持!


  1. 许可、可用性与使用条款

8.1.0 许可

OmniA© 采用 CreativeML Open RAIL++-M 许可证(修改版) 发布。该许可证促进开源研究、非商业用途(下文另有说明的例外情况)及社区驱动的改进。用户被鼓励查阅完整许可证文本以了解详细条款。

8.3.0 使用条款与条件:

8.3.1 - OmniA© 发布的明确条件是,访问和使用该模型或其衍生模型进行图像生成,原则上必须完全免费,不得要求用户消耗积分、虚拟货币、加密货币或任何类似机制来限制核心生成功能的使用。

8.3.2 - 上述条件的特定例外仅授予以下平台:Civitai - https://civitai.com 和 Mage.space - https://www.mage.space。这些平台被允许在其平台专属的虚拟货币、加密货币或积分系统(如 Civitai 上的 “Buzz”)与使用 OmniA© 模型生成图像时关联使用。

8.4.1 - 所有其他托管或提供访问 OmniA© 或其衍生模型的平台、实体、应用程序或服务,均被明确且毫不含糊地禁止 对使用 OmniA© 或其衍生模型直接生成图像的行为,实施任何形式的付费、积分系统、虚拟货币、加密货币(无论是否平台专属)或真实货币交易。除 Civitai 和 Mage.space 外,任何平台使用 OmniA© 或其衍生模型时,均不得收取此类费用或要求使用虚拟货币。

8.5.1 - 您可在所有其他整合了付费或积分系统以生成图像的平台、实体、应用程序或服务上托管 OmniA© 模型或其衍生模型,但前提是必须完全符合第 8.3.0 条款、第 8.3.1 与第 8.4.1 小节。

8.5.2 - 如果您计划在任何整合了付费或积分系统用于图像创作的平台、实体、应用程序或服务上托管 OmniA© 模型或其衍生模型,且该使用方式不符合本许可证第 8.3.0 条款、第 8.3.1 与第 8.4.1 小节,请遵循以下联系方式:

  • 如直接托管 OmniA© 模型
    请联系我们:legal[dot]department[at]omnia-diffusion[dot]com

  • 如托管基于 OmniA© 的衍生模型
    请联系该特定衍生模型的相应作者。

8.5.3 - 请明确标注完整模型名称 OmniA©,并附上模型卡链接:/model/1654876

8.6.0 - 您可自由将 OmniA© 模型用于商业目的,但仅限于3人或以下的团队。

此模型生成的图像

未找到图像。