Animated Character in Real Photo

详情

模型描述

提示格式:

真实照片中的动画角色,以 { 平面着色 | 写实 } 动漫风格绘制,一位年轻的动漫风格 { 女孩 | 女性 | 男孩 | 男性 },{ 你的提示 }

其他标签:

构图:

  • 全身、中景、中近景、特写、广角

质量:

  • 过曝、模糊、低分辨率、胶片颗粒、暗角、JPEG伪影

推荐强度: 0.6 <-> 1.0

我希望添加一些展示3D动漫角色在真实环境和情境中的图片。如果你读到这里并愿意提供访问权限或知道优质资源, 请留言或私信我 。:)

同时上传两个模型,分别在3000步和1500步训练,因为两者效果都不错,且表现方式有明显差异。

这只是在发布 Z-Image-Base 模型前的一次测试训练。我也想对 Chroma 进行一次训练。

训练详情:

使用 ai-toolkit(提交版本 <2d30dc5d>)在单张 RTX 4090 上训练。

批次大小为10,分辨率为512,DOP 目标为保留“照片”。

完整训练配置将在训练数据部分上传。

数据集:

使用一个由人工收集和整理的135张图像数据集进行训练,内容主题为“动漫融入现实”。

约一半图像来自 DanBooru,标签为“照片背景”和“动漫在现实生活中”。

另一半图像来自 www.joyreactor.cc,标签为“Тульпа”,或通过雅虎图像搜索“动漫在现实生活中”获取。

标注:

数据集中的图像使用 JoyCaption beta 进行标注,随后人工清洗和修正。

对于图像中角色呈现写实或半写实光影效果的,标注为“以写实动漫风格绘制”。(54张)

对于图像中角色呈现明显平面光影或粗厚卡通轮廓的,标注为“以平面着色动漫风格绘制”。(74张)

由于该标签具有主观性,可能存在一致性不足的问题,这是未来可改进之处。

由于难以找到超高质量图像,模型可能偏向于2D日式插画风格,或角色仿佛叠加在背景上的效果。

大多数含水印的图像保持原样并相应标注。据我所知,标注中未包含任何角色名或作品名。

由于数据集中大量图像似乎拍摄于俄罗斯,凡明显符合此情况的图像均添加了标签“似乎拍摄于俄罗斯”。模型可能仍对这些背景设定存在偏好。

数据集中99%的图像均为安全内容(SFW)。

此模型生成的图像

未找到图像。