Pixel-Dust CC0 Rebild Attempt VAE
详情
下载文件
模型描述
CC0_rebuild_attempt
版本号: 0.2
概述
CC0_rebuild_attempt 是一个基于 Stable Diffusion 1.5 架构的文本到图像模型。该模型仅使用 CC0 图像及其他宽松许可内容进行训练,旨在根据给定的文本提示生成高质量的艺术图像。目标是创建一个强大且多功能的模型,同时确保所用数据集完全属于公共领域,允许无限制使用。
在图像标注的制作中采用了混合技术:数据集按主题分段,针对不同主题使用了不同的方法,例如:使用 GIT 处理写实类和照片类图像,使用 CLIP 处理插画类图像,最终所有标注均经过人工校正。
训练概述
输入: 手动标注的 768x768 图像
输出: 图像
架构: Stable Diffusion 1.5
性能限制
由于 CC0 及宽松许可内容数据集的限制,CC0_rebuild_attempt 在生成高度细节化或写实图像时可能面临挑战。此外,在高质量、多样化 CC0 图像稀缺的特定领域,该模型的性能可能较差。
训练数据集限制
该模型使用来自以下来源的图像和内容进行训练:
Pexels: Pexels 许可证
LIBRESHOT: CC0
Unsplash: 轻量数据集许可证
opengameart.org:CC0
作者: CC0
贡献者: CC0
大都会艺术博物馆开放访问: CC0
尽管数据集由 CC0 和宽松许可内容组成,但为尊重各网站政策及创作者偏好,仅发布明确允许再分发的图像。其余图像将被索引但不重新分发。
这些数据集可能无法全面覆盖所有主题或内容。由于在这些许可下此类内容有限,数据集中可能缺乏某些现代或小众主题的代表性。此外,该模型的训练和开发以遵守巴西版权法为优先,该法律因缺乏“合理使用”条款而比其他司法管辖区更为严格。
需注意的是,尽管已竭尽全力确保模型生成合乎道德且高质量的内容,但无法保证模型在所有情况下均能避免生成不期望的内容,或在每个实例中都达到最高质量。本项目是在现有数据集与法律限制下,尝试构建一个合乎伦理的模型。
各国版权法存在差异,本项目承认有必要建立关于公共领域内容使用的指导方针。我们希望此项研究能激励更多人构建更负责任的模型,充分考虑版权法的复杂性与训练数据的伦理使用。
商业用途前请先联系作者。
相关风险
模型在生成图像中的高精度文字内容方面可能表现不佳。
在构建需要深度构图理解的复杂场景时可能存在局限。
生成图像的质量与多样性取决于 CC0 及宽松许可内容的可用性与多样性。
可能存在对 CC0 及宽松许可内容数据集中更常见主题与风格的偏向,以及手动标注的偏差。
请查阅 OpenRAIL 并负责任地使用开源框架。
预期用途
生成艺术与设计项目
生成式 AI 的教育工具与研究
创意实验与艺术表达
伦理开发的参考依据
作者说明
我坚信,知识产权法常被用作控制与限制内容访问的手段,实际上形成了一种审查机制。当公司使用未经授权的内容时,往往无人追究;但对个人而言,后果却严重得多。许多大型模型过去和现在都在使用未经授权的内容,这种情况不太可能改变。这是一个令人遗憾的现实,此前已发生,未来仍将不断重演。然而,这是这些技术首次以开源形式广泛开放给所有人。社会的命运不应由政府或公司决定,而应由个体的努力与行动决定。我们或许需要重新思考什么是“原创”或“创意”。同时,随着人工智能与版权领域不断演变,这种视角的转变至关重要。我希望本项目能激励生成式 AI 领域更多负责任和合乎伦理的开发实践。



