Kousaka Reina/高坂麗奈 (Sound! Euphonium)
详情
下载文件
关于此版本
模型描述
- 由于 Civitai 的服务条款,部分图片无法上传。完整的预览图片请见 HUGGINGFACE。
- 对于模型版本 v1.5.1 或 v2.0+,您可以像使用其他 LoRA 一样直接在 WebUI 中使用,它们是使用 kohya 脚本训练的。
- 对于模型版本 v1.5 或 v1.4-,您需要同时使用两个文件才能运行。详细用法请参见描述中的“如何使用 Pivotal Tuned 模型”。
- 精简后的角色标签为:黑发、长发、紫眼。当角色的核心特征(例如发色)不够稳定时,您可以在提示词中添加这些标签。
- pt 文件的推荐权重为 0.7–1.1,LoRA 的推荐权重为 0.5–0.85。
- 图片是使用一些固定提示词和基于数据集的聚类提示词生成的,使用了随机种子,排除了人工挑选。您所看到的就是您能获得的效果。
- 服装没有进行专门训练。您可参考我们提供的预览图,获取对应服装的提示词。
- 本模型使用 780 张图像 进行训练。
- 训练配置文件见 这里。
- 我们自动选择的步骤为 5040,以平衡模型的保真度与可控性。以下是所有步骤的概览,您可在 huggingface 仓库 - CyberHarem/kousaka_reina_soundeuphonium 中尝试其他推荐步骤。

如何使用此模型
本部分仅适用于模型版本 v1.5.1 或 v2.0+。
您可以像使用其他 LoRA 一样直接使用它。我们使用 kohya 脚本训练了此模型。
他のLoRAと同様に簡単に使用できます。このモデルはkohyaスクリプトで訓練されました。
다른 LoRA처럼 간단히 사용할 수 있습니다. 우리는 이 모델을 kohya 스크립트로 훈련했습니다。
您可以像其他LoRAs一样简单地使用它。我们使用kohya脚本对该模型进行了训练。
(Translated with ChatGPT)
如果您正在寻找模型中的女仆角色,或对我们的技术感兴趣,可加入我们的 Discord 服务器。
模型训练方式
- 本模型使用 kohya-ss/sd-scripts 训练,图片由 a1111 的 WebUI 和 API SDK 生成。
- 自动训练框架 由 DeepGHS 团队 维护。
- 用于训练的数据集为 CyberHarem/kousaka_reina_soundeuphonium 中的
stage3-p480-1200,共包含 780 张图像。 - 我们自动选择的步骤为 5040,以平衡模型的保真度与可控性。
- 训练配置文件见 这里。
更多训练细节和推荐步骤,请参阅 huggingface 仓库 - CyberHarem/kousaka_reina_soundeuphonium。
如何使用 Pivotal Tuned 模型
本部分仅适用于模型版本 v1.5 或 v1.4-。
本模型包含两个文件。若您使用的是 WebUI v1.6 或更低版本,请务必同时使用这两个文件! 此时,您需要下载 kousaka_reina_soundeuphonium.pt 和 kousaka_reina_soundeuphonium.safetensors 两个文件,将 kousaka_reina_soundeuphonium.pt 放入 embeddings 文件夹,并同时将 kousaka_reina_soundeuphonium.safetensors 作为 LoRA 加载。若您使用的是 WebUI v1.7+,则只需像普通 LoRA 一样使用 safetensors 文件即可。这是因为嵌入式 LoRA/Lycoris 模型现已得到 a1111 WebUI 的官方支持,详情请见 此处。
このモデルには2つのファイルがあります。WebUI v1.6 以下のバージョンを使用している場合は、これらを一緒に使用する必要があります!!! この場合、kousaka_reina_soundeuphonium.pt と kousaka_reina_soundeuphonium.safetensors の両方をダウンロードする必要があり、 その後、kousaka_reina_soundeuphonium.pt を embeddings フォルダに入れ、同時に kousaka_reina_soundeuphonium.safetensors をLoRAとして使用します。 webui v1.7+を使用している場合、一般的なLoRAsのようにsafetensorsファイルを使用してください。 これは、埋め込みバンドルされたLoRA/Lycorisモデルが現在、a1111のwebuiに公式にサポートされているためです。 詳細についてはこちらをご覧ください。
此模型包含两个文件。如果您使用的是 WebUI v1.6 或更低版本,您需要同时使用这两个文件! 在这种情况下,您需要下载 kousaka_reina_soundeuphonium.pt 和 kousaka_reina_soundeuphonium.safetensors 两个文件, 然后将 kousaka_reina_soundeuphonium.pt 放入 embeddings 文件夹中,并同时使用 kousaka_reina_soundeuphonium.safetensors 作为 LoRA。 如果您正在使用 webui v1.7 或更高版本,只需像常规 LoRAs 一样使用 safetensors 文件。 这是因为嵌入式 LoRA/Lycoris 模型现在已经得到 a1111's webui 的官方支持, 更多详情请参见这里。
(Translated with ChatGPT)
触发词为 kousaka_reina_soundeuphonium,精简标签为 black_hair, long_hair, purple_eyes。当某些特征(例如发色)有时不够稳定时,您可以在提示词中加入这些标签。
为何部分预览图与角色不符
所有预览图所用的提示词(点击图片即可查看)均通过聚类算法自动生成,算法基于训练数据集中提取的特征信息。图像生成时使用的种子也是随机生成,且图像未经任何人工筛选或修改。因此,出现上述问题属于正常现象。
在实际使用中,根据我们的内部测试,多数遇到此类问题的模型,其真实效果通常优于预览图表现。您可能唯一需要做的,就是调整所使用的标签。
我觉得这个模型过拟合或欠拟合,该怎么办?
您在此处看到的步骤是自动选择的。我们也为您推荐了其他优质步骤供您尝试。点击 此处 选择您喜欢的步骤。
我们的模型已发布在 huggingface 仓库 - CyberHarem/kousaka_reina_soundeuphonium,其中保存了所有步骤的模型。同时,我们也在 huggingface 数据集 - CyberHarem/kousaka_reina_soundeuphonium 发布了训练数据集,可能对您有帮助。
为何不直接使用更好筛选的图片?
本模型从数据采集、训练、生成预览图到发布,整个流程完全自动化,无人工干预。这是我们团队进行的一项有趣实验,为此我们构建了一整套软件基础设施,包括数据过滤、自动训练和自动发布。因此,若您有任何反馈或建议,我们非常欢迎,这对我们的改进至关重要。
为何无法准确生成期望的角色服装?
我们当前的训练数据来源于多个图像网站。在全自动流程下,难以精确预测角色拥有哪些官方图像。因此,服装生成依赖于训练数据集中标签的聚类分析,以尽可能还原效果。我们将持续优化这一问题,但目前仍存在难以彻底解决的挑战,其服装还原精度也难以达到人工训练模型的水准。
事实上,本模型最大的优势在于精准还原角色本身的固有特征,以及因数据集规模较大而具备较强的泛化能力。因此,本模型非常适合用于更换服装、调整角色姿态,当然,也适合生成角色的 NSFW 图像!😉
以下用户群体不建议使用本模型,我们深表遗憾:
- 对角色原设计有任何细微偏差都无法容忍者。
- 对角色服装还原精度要求极高者。
- 无法接受基于 Stable Diffusion 算法生成图像可能存在的随机性者。
- 不接受使用 LoRA 自动训练角色模型的过程,或认为角色模型训练必须完全手动操作以示尊重者。
- 认为生成图像内容违背自身价值观者。



















