Animated Character in Real Photo
详情
下载文件
模型描述
提示格式:
真实照片中的动画角色,以 { 平面着色 | 写实 } 动漫风格绘制,一位年轻的动漫风格 { 女孩 | 女性 | 男孩 | 男性 },{ 你的提示 }
其他标签:
构图:
- 全身、中景、中近景、特写、广角
质量:
- 过曝、模糊、低分辨率、胶片颗粒、暗角、JPEG伪影
推荐强度: 0.6 <-> 1.0
我希望添加一些展示3D动漫角色在真实环境和情境中的图片。如果你读到这里并愿意提供访问权限或知道优质资源, 请留言或私信我 。:)
同时上传两个模型,分别在3000步和1500步训练,因为两者效果都不错,且表现方式有明显差异。
这只是在发布 Z-Image-Base 模型前的一次测试训练。我也想对 Chroma 进行一次训练。
训练详情:
使用 ai-toolkit(提交版本 <2d30dc5d>)在单张 RTX 4090 上训练。
批次大小为10,分辨率为512,DOP 目标为保留“照片”。
完整训练配置将在训练数据部分上传。
数据集:
使用一个由人工收集和整理的135张图像数据集进行训练,内容主题为“动漫融入现实”。
约一半图像来自 DanBooru,标签为“照片背景”和“动漫在现实生活中”。
另一半图像来自 www.joyreactor.cc,标签为“Тульпа”,或通过雅虎图像搜索“动漫在现实生活中”获取。
标注:
数据集中的图像使用 JoyCaption beta 进行标注,随后人工清洗和修正。
对于图像中角色呈现写实或半写实光影效果的,标注为“以写实动漫风格绘制”。(54张)
对于图像中角色呈现明显平面光影或粗厚卡通轮廓的,标注为“以平面着色动漫风格绘制”。(74张)
由于该标签具有主观性,可能存在一致性不足的问题,这是未来可改进之处。
由于难以找到超高质量图像,模型可能偏向于2D日式插画风格,或角色仿佛叠加在背景上的效果。
大多数含水印的图像保持原样并相应标注。据我所知,标注中未包含任何角色名或作品名。
由于数据集中大量图像似乎拍摄于俄罗斯,凡明显符合此情况的图像均添加了标签“似乎拍摄于俄罗斯”。模型可能仍对这些背景设定存在偏好。
数据集中99%的图像均为安全内容(SFW)。



