UltraRealistic Lora Project

세부 정보

파일 다운로드

모델 설명

주요 목표는 더 ‘생동감 있는’ 이미지를 만들어내는 것이었고, 더욱 활기찬 감정과 역동적인 포즈, 약간의 초보적인 품질을 담아내는 것이었습니다(높은 품질의 이미지도 생성 가능).

P.S: 피드백을 주신 모든 분들께 감사드립니다! 해부학적 문제에 관한 댓글들(여기뿐 아니라 다른 곳에서도)을 확인했고, 모두님들로부터 보내주신 보고서와 예시들을 수집하고 있습니다. 이를 해결하기 위해 몇 가지 방안을 고려중입니다:

  1. 완전한 체크포인트를 학습하는 것 – 일관된 개선을 위한 더 합리적인 방법일 수 있습니다.

  2. 다양한 포즈를 포함하는 더 많은 사진으로 데이터셋을 확장하여 해부학적 정확도를 향상시키는 것.

여러분의 의견은 정말 도움이 됩니다. 다음 업데이트를 계획하는 데 큰 참고가 되고 있습니다.

P.S.2: 안정적이고 고화질의 결과를 얻기 위해 학습을 RunPod로 옮겼습니다. 제 작업과 향후 업데이트를 지원하고 싶으시다면, Ko-fi에서 저를 찾아주세요. 저는 LoRa가 아니라 모델 전반을 세부 조정할 계획입니다. https://ko-fi.com/danrisi

ComfyUI에서 Flux에 사용하는 설정:
CFG=1, Guidance=2.5, Scheduler=Beta, Sampler=dpmpp_2m, Steps=40, Strength=0.8~1.0이 잘 작동하지만, 저는 보통 1을 사용합니다. 단, 손이 나빠질 경우 0.87로 설정합니다.

ComfyUI에서 SD3.5에 사용하는 설정:
CFG=1, Guidance=3.5, Scheduler=sgm_uniform, Sampler=dpmpp_2m, Steps=40, Strength=0.5~1.0이 잘 작동하지만, 저는 보통 0.7을 사용합니다.

V2 - Flux

안정성, 해부학, 전반적인 품질에서 큰 개선을 거쳐 창작물에 더 현실적이고 다양한 가능성을 제공합니다. 이번 업데이트로 LoRA가 더 적응력 있게 바뀌었고, 프롬프트에 따라 고해상도의 현실감에서 의도적으로 낮은 품질의 미학까지 다양한 수준의 품질을 달성할 수 있습니다.

1048장의 이미지로 학습됨.

새로운 점:

안정성 향상: 새로운 버전은 텍스트 기반 프롬프트와 더 잘 작동하며, 더 부드럽고 예측 가능한 결과를 제공합니다.

손 및 해부학 개선: 손과 신체 해부학이 더 세밀해져 생동감 있는 품질이 향상되었습니다.

품질 유연성: 적절한 프롬프트를 사용하면 고품질 및 저품질 미학 모두 조절할 수 있습니다(예시 제공됨).

V1.2 for SD3.5 - Large

SD3.5용으로 거의 동일한 설정으로 버전을 제작하기로 결정했습니다. 개인적으로 보기에 괜찮지만, 일부 상황에서는 해부학적 오류가 Flux보다 더 심각한 경우도 있었습니다. 그러나 미적 요소(색상, 대비 등)는 Flux보다 더 우수한 것으로 나타났습니다. SD3.5가 잠재력을 가지고 있다고 느끼며, 향후 버전도 SD3.5 기반으로 만들 수도 있을 것입니다.

V1.2

데이터셋의 절반 이미지를 교체하고, 프롬프팅 스타일을 변경하며, 손의 품질을 개선하고, 야간 장면에서의 ‘플래시라이트 효과’를 줄였습니다. 전반적인 LoRA 품질도 개선되었기를 바랍니다(기대합니다). 이 버전에서는 V1에서처럼 많은 ‘트리거 단어’를 사용할 필요가 없습니다. 트리거 단어 목록에서 몇 가지만 추가하면 충분합니다.

V1

다른 애매한 LoRA를 또 학습했습니다(이미 여기저기 많이 만들어졌죠).

하지만 제 데이터셋에서 2000년대 사진들을 일부 가져와 추가로 700장의 이미지를 더했습니다. 지금까지 꽤 괜찮은 결과를 얻었지만, 품질 최적화 측면에서 논란이 있었습니다. 품질을 제어할 수 있길 기대했지만, 오히려 모델을 혼란스럽게만 만든 것 같습니다. 데이터셋에는 다양한 품질 단계가 존재했습니다:

  1. 모바일폰으로 촬영한 고해상도 사진, 보이는 아티팩트 없음, 선명하고 날카로움

  2. 디지털 카메라로 촬영한 저해상도 애매한 사진, JPEG 아티팩트 없음, 약간의 노이즈 있음

  3. 모바일폰으로 촬영한 중해상도 사진, 야간 조건으로 인한 약간의 그레인, 중요한 디지털 아티팩트 없음

그리고 이들의 다양한 조합과 변형들입니다. 다음 버전에서는 이런 부분을 제거할 계획입니다. 하지만 지금 제게 가장 잘 맞는 것은:

저해상도, 디지털 카메라로 촬영된 애매한 사진, JPEG 아티팩트 없음, 약간의 노이즈 있음

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.