Miyamoto Hikari PonyXL
详情
下载文件
模型描述
20241130v2.6
由于“待审核”状态,许多图像在可以查看前会被延迟数小时。
来自 SUMMER LESSON 的 Miiyamoto Hikari
触发词:miiyamotohikari
基于 Pony Diffusion V6 XL 检查点训练。
我已对画廊设置了审核机制,因此 NSFW 内容可能不会显示。
更新
改进了角色特征,使其更接近原始风格,解决了上一版本因更换检查点导致的平面化问题。若面部光线混乱,可在负面提示中加入“backlighting”。
然而,当前色调略微偏黄,可通过使用其他检查点来修正。
使用提示
您可以在我的帖子中找到示例提示。
在正向提示中加入如“realistic”、“photorealistic”、“photorealism”等词,甚至提高其权重,以尽可能保留原始风格与特征。
我的提示基本按以下顺序组成:[角色特征] + [风格] + [表情] + [服装] + [镜头与动作] + [背景],您可以根据需要删除或修改。
推荐权重:1~0.6,请根据需求调整,直到角色外观符合您的要求。
推荐放大值约为 1.3~2.0,去噪强度为 0.2
在全身镜头等情况下容易出现面部扭曲,若出现扭曲,建议使用 ADetailer 进行修复。
20241101v2.5
此版本一致性更好,但略显平面化。
20240819v2
触发词:miiyamotohikari
尝试重新训练,并添加了一些新服装。
本模型的训练及其生成的图像仅用于学习目的。
您可在上述图像中找到示例提示。
推荐权重:1.0~0.6,请根据需求调整,直到角色外观符合您的要求。
推荐放大值约为 1.5,去噪强度为 0.2
您可在负面提示中添加“3D”以减少模型的3D风格。
若不添加,则可使结果更贴近游戏风格。
当角色特征变得非常平面或细节丢失时,建议在正向提示中加入如“realistic”、“photorealistic”、“photorealism”等词,甚至提高其权重,以尽可能保留原始形态与特征。
若3D模型风格过于僵硬,可尝试降低模型权重。
若您也对该角色感兴趣,并拥有她其他服装的更清晰截图,请考虑发送一些给我用于数据集。
本次版本在3D与非3D风格之间达到了我满意的平衡。
日志
我在数据集中加入了两张AI生成的图像。我之前尝试过这种方法,但添加过多图像导致模型快速过拟合,结果风格僵硬、缺乏生气。
在接下来的两个版本中,我没有添加任何AI生成图像,数据集中的风格基本保持与3D风格一致。然而,训练后的模型在3D风格下非常僵硬,当在负面提示中加入“3D”后,风格变得非常平面,丢失了大量细节。
我的目标是训练一个在保持角色大部分特征的同时,又不显僵硬的模型。
因此,仍需向数据集中添加其他风格的图像,但具体添加多少,仍是一个问题。
当前模型的问题是:当在负面提示中加入“3D”时,生成的图像会丢失大量细节,线条风格明显;建议在正向提示中加入“realistic”和“photorealism”等标签,并降低模型权重,约0.8效果更佳;
当角色咧嘴笑时,牙齿极易出问题。
仍存在许多问题,我相信基于flux的后续训练将取得更好效果。
20240807 v1
我反复修改数据集标签,并通过增删图像控制变量。
最终,对结果影响较显著的因素之一是“Scale weight norms”值的设置。本次我将其设为1,此前曾尝试过2.5、3.6和5。结果表明,数值越大,拟合现象越严重;反之,模型输出越趋平面化。
学习率调度器选择“余弦退火重启”,共重启3次。目前该模型已达到较平衡的状态,但我并不喜欢当前的模型风格,它略显油腻、单薄,缺乏立体感。
然而,若希望进一步改进,我认为更换检查点将产生最显著的效果。
20240804 v0.5
这是一个对用户不友好的版本。
在积累了一些模型训练经验后,我感觉能更好地训练过去的模型,但现实证明我仍过于天真。此模型尚未达到我的期望。
当前模型的主要问题有:
当在负面提示中加入“3d”时,模型输出结果变得非常平面,角色特征容易丢失;
当未在负面提示中加入“3d”时,模型输出结果非常_僵硬_。
未来,若我的知识有所提升,我可能会继续训练此模型。
我已清理数据集中所有模糊图像、风格不一致图像以及AI生成图像(此类图像易导致快速过拟合),并将数据集分为两部分:一部分为3D模型,另一部分更偏向游戏风格。我将游戏风格部分的训练重复次数设为2,旨在保持角色特征;
我优化了标注,并修正了以往的许多错误。



















