Underboob Cutout (Flux/F1D)

세부 정보

모델 설명

여전히 실험 단계이자 개발 중: v3.1은 약 절반의 확률로 작동하며 다양한 옷에 적용 가능해졌지만, 모든 경우에 일관되게 작동하는 버전을 원합니다. 아직 개선할 부분이 많지만, 자체 하드웨어를 보유한 사용자들에게 시도해볼 만한 수준이라 생각합니다. 몇 차례 테스트를 진행한 결과, 사이트 내 생성기로 적절한 컷아웃을 생성하는 성공률은 약 50/50입니다. ("실패" 사례는 외관상 괜찮지만 컷아웃 효과가 나타나지 않습니다). 유료 생성을 고려 중이라면, 여유가 많지 않다면 이 버전은 보류하는 것을 추천합니다. Flux LoRA를 사용할 때는 인내심을 가지고 반복적 프로세스를 따르는 것이 매우 중요해 보입니다.

트리거 단어: ubcutout, 좁은 컷아웃, 큰 컷아웃, 단일 컷아웃, 분리된 컷아웃

학습 노트

v6.0

  • 상의 스타일에 사용된 블록을 더 체계적으로 테스트 중입니다.

    • 시드: 400x400 1851087289

      • 주요 블록: 7 9 10, 11!, 12

      • 보조 블록: 8 13(포즈?) 22

v5.0

  • 괜찮지만, v3.1만큼 일관성은 없습니다. 더 강력한 버전이 나오면 업로드하겠습니다.

  • v3.1과 동일한 설정이지만, 단일 블록 트랜스포머 5,8,9,10 사용

  • v4.0에서 새로 생성한 데이터셋 사용

v4.0 (실패/크래시)

  • 학습이 1/3 지점에서 크래시 occurred(샘플 이미지와 관련된 문제)하고, 재개 데이터를 저장하지 않아 첫 에포크만 테스트용으로 보유

  • v3.1을 사용해 새로운 데이터를 생성하여 옷의 질감/재질 개선

    • 과도하게 스무스하거나 명확히 업스케일된 이미지를 교체

    • 흰색 배경을 가진 일부 데이터 이미지를 교체

  • 코사인 스케줄링, 3회 반복, T_Max = 402??

    • 잘못 설정했나요? 학습 스텝의 1/3이어야 하지 않나요?
  • 학습률을 0.0001로 복원

  • 정규화 이미지 사용

  • 데이터셋 67장, 총 학습 스텝 4020

v3.1

  • v3.0과 동일하되 코사인 학습률 사용

    • (다음에는 코사인 반복 설정을 올바르게 찾을 필요 있음)

v3

  • 데이터셋을 50장으로 조정, 품질이 낮은 이미지 제거하고 더 나은 이미지 추가

  • 기존 태그를 간소화하고, large cutout, narrow cutout, zipper cutout, single cutout, separate cutouts 지원 추가

  • 학습률을 약간 증가시켜 1.2e-4로 설정

    • e1400에서 0.5e-4로 감소 (e2000 근처에서 과도하게 학습되는 듯 보임)

      • 이 방식은 효과적이지 않았음. 다음에는 학습이 과도해진 시점 근처에서 시작하거나 학습률/스케줄을 완전히 변경해야 함

      • 테스트 결과, e2400은 오히려 괜찮았음. 조금 더 오래 학습시켰으면 좋았을지도

  • rank/alpha를 8로 감소 (~85MB), 의상 스타일 LoRA에는 아마도 과도한 크기일 수 있음

  • 4000 스텝

v2

  • 기본 ai-toolkit 설정 그대로 사용

  • 동일한 설정으로 더 오래 학습하면 작동할 것 같음. 현재는 최소한의 부작용으로 약 10% 확률로 원하는 효과 생성

    • 원단 질감을 단순화하는 경향이 있음

    • 원단을 선명하게 포커싱하기 어려움

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.