CinEro_SD15

세부 정보

파일 다운로드

모델 설명

서문

이 모델은 단순히 재미로 그리고 전문 사진을 보강하는 데 적합한 모델을 구축하기 위한 실험으로 만들었습니다. 저는 니콘 카메라와 다양한 빈티지 렌즈를 사용하고 있습니다. 이 모델이 감성적이고 영화적인 이미지를 생성하며 부드러운 보케와 "아날로그 스타일"을 구현할 수 있기를 기대합니다. 이 모델을 어떤 극단적인 NSFW 콘텐츠로도 학습할 계획이 없음을 명확히 밝힙니다. "cinero" 모델들에서 그런 것을 기대하거나 요청하지 마세요. 제 선호는 예술, 아름다움, 감정입니다.

프롬프트 작성 팁

몇 가지 예시:

  • "[grayscale : [dimmed colors : vibrant color splashes : 16] : 8]" — 이것을 "시간적 트릭"이라고 부릅니다. 이 방식은 현재 스텝에 따라 프롬프트를 동적으로 변경합니다. 이 프롬프트를 사용하면 SD는 17단계에서 "grayscale"을 사용하고, 815단계에서는 "dimmed colors"를, 그 이후에는 "vibrant color splashes"를 사용합니다. 중첩 단계에 엄격한 제한이 없다고 믿습니다. 이 방법을 통해 각 스텝에서 SD가 처리해야 하는 토큰 수를 효과적으로 줄일 수 있습니다(활성 프롬프트 길이 감소). 초기 단계에서는 세부 사항을 명시할 필요가 없으며, 단지 장면의 대략적인 구도만 지정하면 충분합니다. 후반 단계에서는 구성과 조명 설명에 토큰을 쓸 필요가 없다고 생각합니다. 따라서 이 트릭과 많은 스텝을 활용하면 프롬프트를 짧게 유지하면서도 매우 풍부한 프롬프트를 구축할 수 있습니다.
    참고: 위 프롬프트는 SD가 매우 적은 색상으로 장면을 그리되, 일부 영역은 매우 선명한 색으로 강조하도록 유도합니다(예: 회색조 이미지에서 인물의 머리카락이나 옷 일부만 선명한 색으로 표현됨). 반대로, 전체 이미지를 색상으로 채우고 일부 영역만 회색조로 만드는 방식으로 이 효과를 뒤집을 수도 있습니다.

  • [Audrey Hepburn : Milla Jovovich : 16] — Automatic1111의 XYZ 플롯 스크립트를 사용해 한 얼굴에서 다른 얼굴로 부드럽게 전환하는 재미를 즐길 수 있습니다. 이 특정 시간적 트릭은 얼굴/신체 표현에서 가장 현실적이고 정확한 해부학적 구조를 생성하는 데 도움이 됩니다. 이 트릭을 이용해 동적 LoRa 가중치를 구현할 수도 있다고 생각합니다. LoRa에 트리거 단어가 없다면, [ <lora: ...:0.42> : <lora: ...:0.99> : 16]처럼 LoRa 토큰을 직접 사용하거나, 여러 LoRa의 중첩된 "트리거 단어"를 사용할 수 있습니다.

  • "shot on %Brand Name% %Lens Mark Name% vintage lens" — SD가 기억하는 빈티지 렌즈 이름을 찾으면, 사진의 "아날로그 스타일"을 향상시킬 수 있습니다. 저는 "Carl Zeiss Sonar", "Nokton", "Helios 44-2"를 사용해왔지만, 각 렌즈 모델이 고유한 효과를 준다는 것을 확정지을 수는 없습니다. 자신만의 확인된 렌즈 목록이 있다면, 이 모델의 댓글에 커뮤니티와 공유해 주세요. [%PICTURE OF LEELOO saying HELP%]

  • 향후, 아름다운 빈티지 렌즈로 촬영된 많은 이미지를 포함하는 학습 데이터셋을 구축하여 이 모델에 오래된 사진의 정신을 불어넣을 계획입니다. 이를 위해 고유한 트리거 단어를 사용하거나 "vintage lens"라는 표현을 사용할 계획입니다(아직 확정되지 않음).

  • "perfect anatomy", "anatomically correct body", "anatomically correct hand", "perfect hands", "anatomically correct fingers", "perfect limbs anatomy"와 같은 해부학적 표현을 사용하면 정확한 해부학을 얻을 확률이 높아집니다.

  • "smooth bokeh", "swirly bokeh", "depth of field", "smooth background" 등의 단어를 사용해 메인 피사체와 배경 간의 분리도를 높이세요.

  • "turbulent fog", "mist", "haze"를 "mystical lighting"과 함께 사용하면 장면의 깊이가 뚜렷한 분위기 있는 이미지를 얻을 수 있습니다. 차가운 아침 분위기를 원한다면 "early morning"과 "blue hour"라는 표현도 사용하세요.

  • "scary face expression", "surprised expression", "inviting expression", "lustful face" 등을 사용하면 얼굴의 감정 표정과 명확한 "바디 랭귀지"를 얻을 확률이 높아집니다. 효과는 있지만 아직 완전히 뚜렷하지는 않습니다.

이 모델의 우선순위

  • 여성 캐릭터의 영화적인 사진적 사실성(SFW, 소프트코어 NSFW)

  • 자연스러운 신체, 피부 텍스처, [향상 중] 환경(흙, 먼지, 바닥의 물건, 레트로 가구 및 장치)

  • 현실적인 광학/사진 효과(부드러운 와일드 보케, 아날로그 필름 그레인, 왜곡 [제작 중]) — 빈티지 렌즈(Carl Zeiss Sonar, Jupiter 37a, Helios 44-2)

  • [향상 중] 도시 탐험(Urbex), 버려진, 쇠퇴한 실내, 우울한 분위기, 흐린 색상, 안개, 서림

제작 과정

이 모델은 Analog Madness, URPM, Cyber Realistic, epiCRealism, ICBINP, Cine Diffusion을 0.18~0.35의 계수로 병합하여 만들었습니다.

비슷한 특징(영화적 분위기, 대기감, 매력적인 해부학, 소프트코어/에로, 레트로 실내, 아침 야외 등)을 가진 신중하게 선별된 예술 사진 두 개의 데이터셋으로 학습했습니다. 데이터셋 총 이미지 수: 600~700장.

Kohya_SS를 사용해 각 이미지당 20스텝으로 LoRa로 학습한 후, 위 체크포인트들의 병합체에 약 0.3의 계수로 병합했습니다. 효과를 극대화하려면 동일한 이름의 LoRa와 함께 사용하는 것이 좋습니다.

향후 개선 계획

우선순위별로:

  • [완료] 손과 손가락 생성 개선/수정

  • [진행 중] 음울함, 보케, 색수차, 구면수차, 빛 새어나옴, 오래된 아날로그 필름 효과 개선

  • 발과 발가락 생성 수정/개선

  • [진행 중] 더 많은 Urbex, 폐허, 파괴된 실내, 잊혀진/사라진 야외 풍경 추가 (좋은 데이터셋 추천해 주세요 ;)

  • 눈과 해부학의 세부 조정/개선

피드백 환영합니다...

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.