Woman with a snake - Orientalist photography style [Flux]

세부 정보

모델 설명

이 LoRA는 다가오는 년의 뱀과 관련된 대회에서 영감을 받아 만들어졌습니다.

(대회에 대한 자세한 내용은 여기에서 확인하실 수 있습니다: “제출 요청: 년의 뱀 자원!”)

영감과 핵심 아이디어

저는 exLlama prompt enhancer와 OneButtonPrompt를 사용하여 이미지를 생성할 때, 아트데코 스타일의 일러스트레이션에 매료되었습니다. 이 특정 LoRA는 “뱀이 감긴 여자”라는 주제로 프롬프트를 구성하여 생성되었습니다. 이후 이 프롬프트를 사용해 20장의 학습 이미지를 생성하고, 사이트에서 테스트하여 이것이 대회의 요구 사항을 충족하는지 확인했습니다. LoRA는 베타 버전이므로, 가능하면 계속 개선하려고 노력할 예정입니다.

학습 데이터:

미정.

기술적 설정

기술적 세부사항입니다. 저는 다음 모델을 사용하여 간단한 워크플로우를 구성했습니다:

および CLIP용 긍정/부정 프롬프트를 사용했습니다.

약 50장의 이미지를 생성했지만, 업로드 시점에서 단 20장만 필터를 통과했습니다. LoRA가 사이트에 업로드된 후 학습 데이터 이미지를 업로드할 예정입니다. 대회에서 요구하는 콘텐츠 기준을 최대한 준수하려 노력했지만, 일부 이미지에는 다른 등급이 부여될 수 있음을 알려드립니다. 투명성을 위해 여전히 해당 이미지들을 업로드합니다. 따라서 더 나은 결과를 얻기 위해 몇 차례 추가 생성을 고려할 수도 있습니다.

저는 Florence 2 tagger를 사용하여 LoRA 태깅 워크플로우를 적용했고, 이미지를 512x768(WxH)로 리사이즈했습니다.

학습 워크플로우

학습 워크플로우에 대해 설명드리겠습니다. 저는 Kohya 스크립트를 기반으로 한 Kijai의 공식 워크플로우(GitHub - kijai/ComfyUI-FluxTrainer))를 사용했습니다. 20장의 이미지로 LoRA를 학습시켰고, 스텝 수는 _1000_으로 설정했습니다. 그러나 최적의 결과는 200~400 스텝 사이에서 나타났으며, 그 이상(예: 500, 600 스텝 등)은 모델이 과적합되는 경향이 있었습니다. 따라서 제 관찰에 따르면, 이 값은 약 10~20 에포크에 해당합니다. 이 수치는 데이터셋에 따라 달라질 수 있으나, 제 데이터셋에서는 이 범위 내에서 최적의 결과를 얻었습니다.

사용한 체크포인트는 Atomix FLUX Unet (v.1.0)이었습니다. 이는 제가 소유한 유일한 포토리얼리스틱 스타일의 Unet 형식 및 FP8 체크포인트였기 때문입니다. 다른 체크포인트들은 포토리얼리스틱 스타일 학습에는 부적합할 수 있습니다. 학습 파라미터는 fp8 형식을 사용했고, 오프로딩은 사용하지 않았으며, b 설정을 적용했습니다. 자세한 내용은 학습 워크플로우에 명시되어 있습니다.

LoRA는 200, 400, 500, 600, 800, 1000 스텝마다 생성했습니다. 400 스텝 이상에서는 왜곡 및 결함이 발생했기 때문에 이를 제거했습니다. 200 스텝 LoRA는 얼굴 세부 표현이 더 우수해 보였지만, 손에 여러 문제가 있었습니다.

LoRA 배포 및 테스트

모델 배포 및 테스트는 학습에 사용한 동일한 Unet 및 텍스트 인코더를 사용했습니다:

지금까지 가장 좋은 결과는 다음 파라미터로 얻었습니다:

  • LoRA 모델 가중치 — 1.0
  • LoRA CLIP 가중치 — 1.0
  • 스텝 — 15
  • CFG — 1.5
  • 샘플러: Euler
  • 스케줄러: simple

LoRA는 초기 학습 이미지에서 생성된 태그를 기반으로 학습되었으므로, 트리거 단어 대신 예시 프롬프트의 태그 섹션을 사용하세요:

"정면 카메라 각도에서 촬영한, 의자에 앉아 다리에 뱀이 감긴 여성의 포토리얼리스틱 사진. 검은색 스트랩리스 드레스와 여러 개의 목걸이를 착용하고 있다. 이미지에는 어두운 피부를 가진 검은 머리 여성, 중앙에 앉아 있으며 상체를 관찰자 쪽으로 향하고 눈은 카메라를 직시하고 있다. 자신감 있는 표정과 빨간 립스틱을 사용했으며, 날씬한 체형과 드러난 어깨를 지녔다. 흐릿한 조명의 방에서 나무 의자에 앉아 있으며, 뒤 배경에는 갈색 커튼과 장식적인 아치형 문이 있다. 조명은 드라마틱하게, 여성의 몸에 그림자를 만들고 곡선을 강조한다. 여성은 목걸이와 귀걸이를 포함한 검은색 보석을 착용하고, 발은 벗고 있다. 뱀은 그녀의 몸에 감겨 있으며 비늘의 세부 표현이 보인다. 전반적인 분위기는 어둡고 신비롭며, 여성과 뱀에 초점이 맞춰져 있다.

score_9, score_8_up, score_7_up, Orientalist photography의 스타일리즈된 재해석, 마스터피스, 최고 퀄리티, 1girl, solo, breasts, looking at viewer, black hair, dress, jewelry, bare shoulders, sitting, full body, earrings, black eyes, necklace, barefoot, spread legs, feet, lips, toes, chair, black dress, curly hair, arm support, snake, interspecies"

크레딧

해당 모델 및 ComfyUI 노드 개발자들에게 프롬프팅과 워크플로우에 대한 영감을 주셔서 감사합니다. 사용된 모든 모델 및 워크플로우의 크레딧은 각각의 저작자에게 귀속됩니다(AlexLai, JayNL, kijai). 여기에는 언급되지 않았지만 이 이미지를 만들기 위해 필수적인 다른 훌륭한 노드, 모델 및 도구의 개발자들에게도 감사드립니다.

특별한 감사의 말. 또한, 제 LoRA 이미지 생성에 사용된 체크포인트를 제공해 주신 JayNL 에게도 감사드리며, LoRA 생성에 대한 크레딧도 그에게 드립니다.

콘텐츠에 대한 면책 조항

체크포인트는 초기 베타 단계이므로, 별도로 사용하거나(예: dedistilled) 특정 프롬프트와 결합하면 모든 연령층에 적합하지 않은 콘텐츠를 생성할 수 있습니다. 이 LoRA는 실제 인물을 묘사하지 않으며, 테스트 목적에만 사용됩니다.

라이선스

이 LoRA는 학습 워크플로우에서 사용된 Atomix Flux의 라이선스를 계승합니다:

FLUX.1 [dev] 비상업 라이선스 .

FLUX.1 [dev] 모델은 Black Forest Labs, Inc.가 FLUX.1 [dev] 비상업 라이선스에 따라 라이선스를 부여합니다. 저작권 Black Forest Labs, Inc.

Black Forest Labs, Inc.는 본 모델의 사용과 관련하여 계약, 불법행위 또는 기타 이유로 발생하는 모든 청구, 손해 또는 기타 책임에 대해 일체의 책임을 지지 않습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.