FLUX BOOBA

세부 정보

파일 다운로드

모델 설명

주의! 최상의 결과를 얻으려면 아래 내용을 꼭 읽어주세요.

프롬프트는 자연스러운 언어로 사용하세요. 예: "a nude woman blah blah blah". 'nude'는 학습 캡션에서 사용되었기 때문에 'naked'보다 더 나은 결과를 낼 수 있습니다.

  1. Fp8 dev Flux 모델을 사용할 경우, fp8_e4m3fn 버전을 반드시 사용하세요.

  2. LoRA는 강도 0.7~0.75로 사용하세요. 더 높은 강도는 작은 디테일을 더 잘 생성할 가능성을 높이지만, 손가락이 엉망이 되거나 기타 원치 않는 아티팩트가 생길 확률도 증가합니다. 강도를 0.7 이하로 낮추면 이미지의 일관성은 높아지지만 유두의 디테일은 줄어들고, 아래 부분(속옷이 보이기 시작하는 부분)에서 양질의 결과를 얻을 확률도 낮아집니다.

  3. ComfyUI에서 모델 샘플링 Flux 노드를 사용할 때, mas_shift 강도를 0.5, base_shift를 각각 0.5로 설정하세요.

  4. 샘플러로 Euler를, 스케줄러로 Beta를 사용하고, 최소 25스텝을 적용하세요.

  5. 1024x1400 또는 1024x1216과 같은 고해상도에서 가장 좋은 결과를 얻을 수 있습니다. 또한, 최상의 결과를 위해 2:3 비율(세로)을 사용하세요.

이 LoRA에 대한 정보:

이 LoRA는 초기 alpha 버전이며 아직 완성되지 않았습니다. 따라서 생식기나 유두의 디테일은 아직 매우 제한적이고, 일부 아티팩트가 존재할 수 있습니다. 이 LoRA는 "카우보이 샷"(허벅지 위로 보이는) 촬영 각도의 여성 100장의 이미지와 수동으로 작성된 캡션 쌍으로 학습되었습니다. 따라서 이 LoRA로 생성된 이미지는 이 특정 촬영 각도와 시점에 매우 편향됩니다. 다른 각도에서의 여성 이미지를 양질로 생성하려면 LoRA 강도를 낮춰야 변형 및 일관성 문제를 방지할 수 있습니다. 사용 목적에 따라 LoRA 강도를 조정해 보세요. 이는 초기 테스트용 LoRA이므로 기적을 기대하지 마세요. 향후 남성도 포함하고, 더 자연스러운 신체 형태, 다양한 자세, 각도, 촬영 방식을 포함한 더 큰 데이터셋으로 일반화된 LoRA를 개발할 예정입니다. 이 과정은 꽤 오래 걸릴 수 있으므로 인내심을 가져주세요.

학습 과정에 대한 기본 정보:

이 LoRA는 A100에서 simple tuner 학습 스크립트를 사용하여 학습되었습니다(개발자님께 감사드립니다!). LoRA는 fp16 dev 기반 Flux 모델로 학습되었으며, 학습 중 약 27GB의 VRAM을 사용했습니다. A100에서 학습 속도는 약 2.3초/이터레이션입니다. 우리는 prodigy 옵티마이저를 사용했으며, constant 스케줄, 64 rank, 64 alpha, bf16, gamma 5를 적용했습니다. 드롭아웃은 사용하지 않았고, 배치 크기는 1로 설정했습니다(배치 크기 1이 다른 배치 크기보다 더 나은 결과를 낳았습니다).

Flux 모델에서는 노출이 새 개념이기 때문에, 이를 적절히 수렴시키기 위해 최소 350스텝/이미지가 필요하며, 양질의 결과를 위해서는 650스텝/이미지가 필요합니다. 최적의 하이퍼파라미터를 찾기 위해 많은 테스트를 진행했고, 현재의 설정에 도달했습니다(추후 adam8w와 같은 옵티마이저 사용 시 학습 속도가 크게 향상될 것으로 예상되므로 수동 하이퍼파라미터 조정이 더 필요합니다).

기타 참고 사항: fp8 Flux 변형 모델로 학습했을 때, fp16 Flux 모델과 동일한 품질의 결과를 얻었으며, 수렴 속도는 2배 빨랐습니다. 즉, fp8 모델에서는 최소 700스텝, 양질의 결과를 위해서는 1400스텝이 필요했습니다. fp8 Flux 모델 학습 시 우리의 설정으로 약 16.3GB의 VRAM이 소요되었으며, 이 정도 VRAM을 가진 카드에서는 학습이 가능하고, 최적화를 통해 16GB VRAM을 가진 카드에서도 fp8 LoRA 학습이 가능할 수 있습니다.

special thanks to Raj for providing the A100 and for getting the simple training script working, as well as modifying it to suit our needs.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.