Pony: People's Works +

详情

模型描述

v8

肌理更新:强化了以下tag的学习:

realistic, photorealistic, flat color,
shiny skin, matte skin, shiny hair,

请注意,在danbooru数据集中有很多个用于描述“照片”和“接近照片的风格”的tag。我在训练集中统一标注这些图片为“photorealistic”。但是使用danbooru训练集训练的SDXL模型大多并不能很好地画出写实图像,因此“photorealistic”只建议在较小权重下用于改变画面的肌理。“realistic”可以在高权重下正常运作。

请注意,Danbooru数据集包含多个用于描述“照片”或“照片风格”的标签。我在数据集中将所有这类图像统一标注为“photorealistic”。
然而,大多数在Danbooru数据集上训练的SDXL模型并不能很好地生成写实图像。因此,“photorealistic”仅建议在低权重下使用,以调整画面质感,而非实现写实效果。“realistic”标签在高权重下可正常运作。

快速上手 | Quick Start

这是什么? | What is this?

  • Pony: People's Works(ppw)是一个实验性的微调模型系列,其数据集约85%来源于CivitAI上用户发布的AI生成图像。早期ppw的数据集最初基于pony v6生成的图像构建,因此本系列模型的输出也带有Pony Diffusion的特征。

  • 本系列模型使用标准Danbooru标签,主要擅长生成中、近景风格化人像。其主要作用是在不使用画师串、减少质量提示词的前提下,使基础模型获得相对稳定的图像质量,从而为提示词节约token空间。
    本模型并非风格模型,在不同提示词和生成条件下可能会有细微的画风差异。

  • Pony: People's Works (ppw) 是一个实验性微调模型系列,约85%的数据来自CivitAI上用户发布的AI生成图像。由于早期ppw的数据集基于pony v6生成的图像构建,本系列模型的输出也带有Pony Diffusion的特征。

  • 本系列模型采用标准Danbooru标签,主要优化用于生成中、近景风格化人像。其主要作用是使基础模型在无需画师关键词或冗长质量提示词的情况下,仍能获得相对稳定的图像质量,从而为提示词节省token空间。
    这些模型并非风格LoRA,在不同提示词和生成条件下可能出现细微的风格差异。

版本信息 | Version Info.

  • 本页面发布的是ppw的高维LoCon版本,也是本项目的主页面。

  • LoCon版本的ppw可灵活搭配各类功能LoRA和基础模型,且效果强度更具可控性。高维度LoCon拥有更强的泛化能力和细节表现,但会占用更多存储空间和计算资源。

  • 主要用于在线生成服务,以及供高性能设备用户本地部署使用。

  • 本页面提供ppw的高维LoCon版本,为本项目主页面。

  • ppw的LoCon版本可灵活搭配各类功能LoRA与基础模型,效果强度更具可控性。高维LoCon具备更强的泛化性与细节表现,但需消耗更多存储空间和计算资源。

  • 主要面向在线生成服务及高性能PC用户本地使用。

精简版LoCon | Lightweight LoCon ver.

基础模型版 | Checkpoint versions (Illustrious)

基础模型版 | Checkpoint versions (NoobAI)

更多 | more

使用方法 | Usage

positive:

masterpiece, best quality, very aesthetic

negative:

low quality, displeasing

更新记录 | Change log

v7

v7版本对数据集结构进行了较大调整,并采用了不同的训练参数与策略,因此可能不如原版本稳定。

在CivitAI在线生成器上,v-pred模型的表现与TensorArt的在线生成结果完全不同,相同参数无法复现,原因不明……

TensorArt版本 CivitAI版本(相同参数) CivitAI高权重版本

v7版本简介:

这是一个基于前作数据集发展而来的图像质量LoCon,约90%-95%的图像数据来自CivitAI上发布的图像。

它使模型在不依赖画师串、仅使用少量质量提示词的条件下,实现相对稳定的图像质量,从而节省更多token空间,同时还能修复模型固有的一些生成缺陷(但不包括手部)。

由于数据集来源,生成图像会带有Pony的质感。但因其不指向特定画师、风格或技法,因此在不同提示词与模型条件下可能呈现细微的风格差异。

这是一个基于前作数据集开发的图像质量LoCon,约90%-95%的图像数据来源于CivitAI用户发布的图像。

它帮助模型在不依赖画师串、仅使用少量质量提示词的前提下,实现相对稳定的图像质量,从而释放更多token空间,并修复部分模型固有的生成缺陷(但不包括手部)。

由于数据集来源,生成图像会带有Pony的质感。然而,由于它不指向任何特定画师、风格或绘画技法,不同提示词与模型下可能出现细微的风格差异。

数据集来源及许可证 | Dataset Source & License

  • 数据集中每张图像均由作者人工筛选、分类与标注编辑,数百张图像经过手工修正。

  • 本模型为免费开源模型,用户可在个人设备上自行部署。作者不通过模型销售获取任何报酬。作者不限制本系列模型用于商业生成服务商业图像生成用途,但请注意配合使用的Checkpoint及其他LoRA的许可证限制。

  • 数据集中约90%-95%为AI生成图像,但请注意其中约250+张图像来自公共媒体、新闻或出版物,用于概念补充。未来版本将逐步替换这些素材。商业用户请自行评估相关风险。

    本数据集未训练任何独立画师的数据,也未标注任何画师信息(不排除AI错误标注的可能)。

  • 此外,本模型禁止用于闭源商业用途、模型出售,或合并至闭源商业模型。对于开源模型用于生成服务的情形无限制,但建议标注融合模型的来源。

  • 数据集中每张图像均由作者人工筛选、分类和标注编辑,其中数百张图像经过手工修正。

  • 本模型为免费开源模型,用户可在个人设备上自行部署。作者不通过模型销售获取任何报酬,且不限制本系列模型用于商业图像生成服务商业用途,但请留意配合使用的Checkpoint及其他LoRA的许可证限制。

  • 数据集中约90%-95%为AI生成图像,但包含约250+张来自公共媒体、新闻或出版物的图像,用于概念补充。未来版本将逐步替换这些素材。商业用户请注意相关法律与版权风险。

    本数据集未包含任何独立画师的训练数据,也未标注任何画师信息(不排除AI错误标注的情况)。

  • 此外,本模型禁止用于闭源商业用途、模型销售,或合并至闭源商业模型。对于开源融合模型用于生成服务的情形无限制,但建议注明融合模型的来源。

此模型生成的图像

未找到图像。