Isayama Yomi (Ga-Rei: Zero)

详情

模型描述

  • 由于 Civitai 的服务条款,部分图片无法上传。完整的预览图片请见 HUGGINGFACE
  • 此模型包含两个文件。如果你使用的是 a1111 的 WebUI v1.6 或更低版本,你必须同时使用这两个文件!!!。如果你使用的是 WebUI v1.7+,则像普通 LoRA 一样仅使用 safetensors 文件即可。
  • 精简后的角色标签为:black_hair、long_hair、bangs、blunt_bangs、purple_eyes、hime_cut。当角色的核心特征(如发色)不够稳定时,你可以在提示词中添加这些标签
  • pt 文件推荐权重为 0.7–1.1,LoRA 权重为 0.5–0.85。
  • 图片是使用一些固定提示词和基于数据集的聚类提示词生成的,采用了随机种子,排除了人为挑选。你所看到的就是你能得到的
  • 服装方面未进行专门训练。你可以查看我们提供的预览帖子,获取对应服装的提示词。
  • 本模型使用 488 张图像 进行训练。
  • 我们自动选择的步骤为 4026,以平衡模型的保真度与可控性。以下是所有步骤的概览。你可以在 huggingface 仓库 - CyberHarem/isayama_yomi_gareizero 中尝试其他推荐的步骤。

步骤概览

如何使用此模型

此模型包含两个文件。如果你使用的是 WebUI v1.6 或更低版本,必须同时使用这两个文件!!!。在这种情况下,你需要下载 isayama_yomi_gareizero.ptisayama_yomi_gareizero.safetensors 两个文件,然后isayama_yomi_gareizero.pt 放入 embeddings 文件夹,并同时将 isayama_yomi_gareizero.safetensors 作为 LoRA 使用如果你使用的是 WebUI v1.7+,只需像常规 LoRA 一样使用 safetensors 文件即可。这是因为嵌入式 LoRA/Lycoris 模型现已得到 a1111 WebUI 的官方支持,更多详情请参见 此处

このモデルには2つのファイルがあります。WebUI v1.6 以下のバージョンを使用している場合は、これらを一緒に使用する必要があります!!! この場合、isayama_yomi_gareizero.ptisayama_yomi_gareizero.safetensors の両方をダウンロードする必要があり、 その後、isayama_yomi_gareizero.ptembeddings フォルダに入れ、同時に isayama_yomi_gareizero.safetensors をLoRAとして使用しますwebui v1.7+を使用している場合、一般的なLoRAsのようにsafetensorsファイルを使用してください。 これは、埋め込みバンドルされたLoRA/Lycorisモデルが現在、a1111のwebuiに公式にサポートされているためです。 詳細についてはこちらをご覧ください。

此模型包含两个文件。如果您使用的是 WebUI v1.6 或更低版本,您需要同时使用这两个文件! 在这种情况下,您需要下载 isayama_yomi_gareizero.ptisayama_yomi_gareizero.safetensors 两个文件, 然后isayama_yomi_gareizero.pt 放入 embeddings 文件夹中,并同时使用 isayama_yomi_gareizero.safetensors 作为 LoRA如果您正在使用 webui v1.7 或更高版本,只需像常规 LoRAs 一样使用 safetensors 文件。 这是因为嵌入式 LoRA/Lycoris 模型现在已经得到 a1111's webui 的官方支持, 更多详情请参见这里

触发词为 isayama_yomi_gareizero,精简标签为 black_hair, long_hair, bangs, blunt_bangs, purple_eyes, hime_cut当某些特征(例如发色)有时不够稳定时,你可以将这些标签添加到你的提示词中

模型训练方式

  • 本模型使用 HCP-Diffusion 训练。
  • 自动训练框架DeepGHS 团队 维护。
  • 训练所用的基础模型为 deepghs/animefull-latest
  • 训练使用的数据集为 CyberHarem/isayama_yomi_gareizero 中的 stage3-p480-800,共包含 488 张图像。
  • 批量大小为 4,分辨率为 720x720,聚类为 5 个桶。
  • 正则化数据集的批量大小为 6,分辨率为 720x720,聚类为 10 个桶。
  • 训练共进行 4880 步,保存并评估了 40 个检查点。
  • 我们自动选择的步骤为 4026,以平衡模型的保真度与可控性

更多训练细节和推荐步骤,请参阅 huggingface 仓库 - CyberHarem/isayama_yomi_gareizero

为何部分预览图片与角色形象不符

所有预览图片中使用的提示词(可通过点击图片查看)均是基于训练数据集中提取的特征信息,通过聚类算法自动生成。图像生成时使用的种子也是随机的,且未经过任何人工筛选或修改。因此,可能会出现上述问题。

在实际使用中,根据我们的内部测试,多数遇到此类问题的模型表现往往优于预览图所示效果。你唯一可能需要做的,就是调整你使用的标签

我觉得此模型可能过拟合或欠拟合,该怎么办?

你所看到的步骤是自动选定的。我们还为你推荐了其他优秀的步骤供尝试。点击 此处 选择你偏爱的步骤。

我们的模型已发布在 huggingface 仓库 - CyberHarem/isayama_yomi_gareizero,其中保存了所有步骤的模型。同时,我们也将训练数据集发布于 huggingface 数据集 - CyberHarem/isayama_yomi_gareizero,或许对你有帮助。

为何不直接使用筛选后的优质图片?

本模型从数据采集、训练、生成预览图到发布,整个流程100% 自动化,无人工干预。这是我们团队进行的一项有趣实验,为此我们开发了一整套软件基础设施,包括数据过滤、自动训练和自动化发布。因此,若有可能,我们非常欢迎更多反馈或建议,这对我们的工作极具价值。

为何无法精确生成期望的角色服装?

我们当前的训练数据来自多个图片网站,对于全自动流程而言,准确预测某个角色拥有哪些官方图像是非常困难的。因此,服装生成依赖于基于训练数据集标签的聚类分析,以尽可能还原最佳效果。我们将持续改进这一问题,但仍难以完全解决。服装还原的准确性也不太可能达到人工训练模型的水平。

事实上,本模型的最大优势在于还原角色本身的固有特征,以及凭借更大数据集所具备的较强泛化能力。因此,本模型非常适合用于更改服装、调整角色姿态,当然,也适用于生成角色的 NSFW 图像!😉

对于以下群体,我们不推荐使用本模型,并深表歉意:

  1. 对角色原始设计有任何细微偏差都无法容忍者;
  2. 应用场景对角色服装还原精度要求极高者;
  3. 无法接受基于 Stable Diffusion 算法生成图像中潜在随机性者;
  4. 不适应使用 LoRA 自动训练角色模型的流程,或认为训练角色模型必须完全手工操作以示尊重者;
  5. 认为生成内容冒犯自身价值观者。

此模型生成的图像

未找到图像。