Facezoom for Kontext

详情

下载文件

模型描述

Facezoom

Boom!爆头!放大面部并增强细节,效果远优于普通kontext。
在对比图中,裁剪的原图是使用YOLO进行的自动边界框裁剪,虽然你也可以使用这种方式,但这个LoRA或许能替代你工作流中的面部裁剪+放大步骤。

V1.1:

训练分辨率为1024px,而非768px
生成更一致的裁剪结果
细节更优

面部拉伸现象减少

提示词

f4cezoom

可添加其他面部修改、表情、眼睛颜色等作为修饰参数,任何kontext标准能做的都可以使用。

推荐设置

Flux引导值:3(2.5-3.5)

去噪强度:1(0.95-1)

强度:1.25(1.00-1.25)

局限性

  • 并非魔法,严重像素化或噪点过多的图像效果不佳

  • 种子变量性:若未获得理想裁剪,可尝试更换种子

  • 有时面部可能轻微拉长

  • 对横向构图效果不佳

  • 多人物场景效果不稳定

使用 Ostris AI-Toolkit 训练

设置

      train_unet: true

      train_text_encoder: false

      gradient_checkpointing: true

      noise_scheduler: flowmatch

      optimizer: adamw8bit

      timestep_type: sigmoid

      content_or_style: balanced

      optimizer_params:

        weight_decay: 0.0001

      unload_text_encoder: true

      lr: 0.0001

      ema_config:

        use_ema: true

        ema_decay: 0.99

此模型生成的图像

未找到图像。