Racing Women

세부 정보

모델 설명

나는 이 LoRA를 여성들이 매력적인 레이싱 복장을 입은 이미지를 생성하는 데 도움이 되길 바라는 마음으로 만들었다. 이는 특정한 실제 스타일을 타겟으로 하지 않으며, 약간의 섹슈얼한 암시를 포함한다.

내 소스 이미지는 XL, Z-Image, 심지어 Qwen Image Edit 2511을 사용해 생성했지만, 나는 이 장르를 특별히 좋아하지 않기 때문에 얼굴이 실제 인물과 얼마나 잘 맞는지 잘 모르겠다. 개인적으로는 신경 쓰지 않지만, 관련된 복장이 가질 수 있는 잠재력은 좋아한다. 나의 의도는 물론 이 LoRA를 만들 때 실제 인물의 유사성을 피하는 것이다.

실제 이미지를 사용하지 않았지만, 나는 모든 얼굴을 흰색으로 덮어 지웠고, 시스템 지시 없이 이를 바탕으로 LoRA를 생성했으며, 추론 시 대부분 얼굴이 없는 여성 이미지가 생성되었다.

나는 복장의 다양한 세부 사항과 색상을 프롬프트로 입력하고, 앉아 있거나 기대고 있거나 그냥 서 있는 모든 자세를 상상했다.

그 집합에서 대부분의 배경을 제거하고, 각각에 다양한 크기의 흰색 배경을 추가한 후, 어떤 부분을 변경해야 특정 복장 스타일, 자세, 환경으로 학습을 유도할 수 있을지 검토했다.

그 후 최종 데이터셋을 위해 qwen-image-edit-2511을 사용해 새로운 이미지 세트를 프롬프트로 생성했고, 얼굴을 복구하고 내가 원하는 세부 사항을 추가했는지 확인했다.

그러나 수백 장의 이미지 집합을 진행하는 중간쯤, Flux Klein이 등장했고, 나는 기본 버전과 4단계 버전 모두를 철저히 테스트한 끝에 4단계 비양자화 버전을 선택하고 6단계까지 확장했다. 이 모델과 워크플로우를 사용해 데이터셋을 완성했는데, 이는 허용 가능한 소스 자료를 매우 빠르게 생성해냈다.

나는 결과를 빠르게 검토하여 결함과 불일치를 점검하고, 일부 이미지를 다시 보내서 수정하거나 이전에 생각하지 못했던 요소를 추가했다. 그 후, 내가 원하는 목표에 부합하는 50장을 선택했다.

이것이 내가 학습에 사용한 데이터셋이며, 많은 하이퍼파라미터를 조정하지는 않았다. 단지 일부 다양성을 위해 512와 768 차원을 추가하고, 풍경 이미지의 품질을 향상시키기 위해 학습 단계를 20,000단계로 늘렸으며, 약 3시간이 걸렸다.

데이터셋의 어느 단계에서도 노출이나 성적 상황은 전혀 포함되지 않았다.

나는 대부분의 LoRA 설명에 이렇게 자세히 쓰지 않지만, 이런 방식으로 몇 개를 만들어두면 다른 사람들이 내 방법을 테스트해보고, 그것이 그들에게 효과가 있는지 확인할 수 있기를 바란다. 위의 단계들을 사용했든 사용하지 않았든, 여러분의 경험을 알고 싶다.

나는 각 단계에서 자동 캡셔닝을 수행했다는 것을 언급하지 않았다. 자동 캡셔닝을 선호하는 이유는, 이후 다른 학습된 요소들을 결합할 때 도움이 된다고 믿는 많은 가중치 개념을 제공하기 때문이다. 물론 이 방법이 더 쉽고 빠르며, 생성된 캡션에 종종 포함된 오류들은 나에게 식별 가능한 방식으로 나타나지 않는다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.