Lab @6 : old man girl (with beard)

详情

下载文件

模型描述

引言

这次:

尝试训练 LoRa,让女孩看起来像留着胡子的老人。

胡子是男性较强的特征,因此通过提示词很难生成一张“1girl, 1boy”图像,其中女孩有胡子而男孩没有。这个 LoRa 的目标是探索是否能让这一过程变得更简单。

纯属学习用途,不必太认真对待。

注意:如果效果不佳,请提高 LoRa 权重(例如设为 1.2)再试。

注意2:数据集(含正则图像集)已包含在内,请查看下载文件列表。

稍后我会上传全部 6 次尝试的成果,包括数据集和正则图,或许还能分享一些我学到的经验。

已知问题:

手和手臂有时会出错。

发现

  • lab_6_6:效果有希望,但仍存在问题

    • 问题:

      • 色彩:

        • 倾向于偏棕色?

        • 色彩不够丰富

      • 构图:

        • 手和脚绘制不佳
      • 嘴部:

        • “男女孩”往往呈现“闭嘴”状态
      • 风格:

        • 感觉 LoRa 被固定了一种风格?
    • 计划:

      • 或许修正数据集(单人版本质量较低)

      • 8 张图片对于此类任务而言不够

训练参数

基础参数请参见 Lab Index(通常相同)

以下是每轮尝试中的差异部分:


- 第6轮
    - 训练数据:
        - 数据集
            - 通用标记:lr-malegirl,
                - 包含部分与胡子相关的标记(用于控制胡子颜色……帮助模型理解胡子特征)
            - 4p(20次),1girl 单人,
            - 4p(20次),1girl 1boy,
        - 正则图:普通1girl,每张图重复2次
    - 尺寸:1024 x 1152
    - DIM:16,8
    - 保留 N 个标记:1

- 第5轮
    - 训练数据:
        - 数据集
            - 通用标记:lr-malegirl,
                - 不包含胡子相关标记,
            - 4p(20次),1girl 单人,
            - 4p(20次),1girl 1boy,
        - 正则图:普通1girl,每张图重复2次
    - 尺寸:1024 x 1152
    - DIM:16,8
    - 保留 N 个标记:1

- 第4轮
    - 训练数据:
        - 数据集
            - 通用标记:lr-malegirl,
                - 不包含胡子相关标记,
            - 4p(10次),1girl 单人,
            - 4p(10次),1girl 1boy,
        - 正则图:普通1girl,每张图重复1次
    - 尺寸:1024 x 1152
    - DIM:16,8
    - 保留 N 个标记:1

- 第3轮
    - 训练数据:
        - 数据集
            - 通用标记:lr-malegirl,
                - 不包含胡子相关标记,
            - 4p(15次),1girl 单人,
        - 正则图:普通1girl,每张图重复1次
    - 尺寸:832 x 1216
    - DIM:16,8
    - 保留 N 个标记:1

- 第2轮
    - 训练数据:
        - 数据集
            - 通用标记:oldmangirl,
                - 包含胡子标记,
            - 4p(24次),1girl 单人,
        - 正则图:与数据集相同,4p(15次)
    - 尺寸:832 x 1216
    - DIM:16,8
    - 保留 N 个标记:0

- 第1轮
    - 训练数据:
        - 数据集
            - 通用标记:old man malegirl,
                - 包含胡子标记,
            - 4p(15次),1girl 单人,
        - 正则图
            - 与数据集相同,4p(15次)
    - 尺寸:832 x 1216
    - DIM:16,8
    - 保留 N 个标记:0

此模型生成的图像

未找到图像。