CinEro_SD15
세부 정보
파일 다운로드
모델 설명
서문
이 모델은 단순히 재미로 그리고 전문 사진을 보강하는 데 적합한 모델을 구축하기 위한 실험으로 만들었습니다. 저는 니콘 카메라와 다양한 빈티지 렌즈를 사용하고 있습니다. 이 모델이 감성적이고 영화적인 이미지를 생성하며 부드러운 보케와 "아날로그 스타일"을 구현할 수 있기를 기대합니다. 이 모델을 어떤 극단적인 NSFW 콘텐츠로도 학습할 계획이 없음을 명확히 밝힙니다. "cinero" 모델들에서 그런 것을 기대하거나 요청하지 마세요. 제 선호는 예술, 아름다움, 감정입니다.
프롬프트 작성 팁
몇 가지 예시:
"[grayscale : [dimmed colors : vibrant color splashes : 16] : 8]" — 이것을 "시간적 트릭"이라고 부릅니다. 이 방식은 현재 스텝에 따라 프롬프트를 동적으로 변경합니다. 이 프롬프트를 사용하면 SD는 1
7단계에서 "grayscale"을 사용하고, 815단계에서는 "dimmed colors"를, 그 이후에는 "vibrant color splashes"를 사용합니다. 중첩 단계에 엄격한 제한이 없다고 믿습니다. 이 방법을 통해 각 스텝에서 SD가 처리해야 하는 토큰 수를 효과적으로 줄일 수 있습니다(활성 프롬프트 길이 감소). 초기 단계에서는 세부 사항을 명시할 필요가 없으며, 단지 장면의 대략적인 구도만 지정하면 충분합니다. 후반 단계에서는 구성과 조명 설명에 토큰을 쓸 필요가 없다고 생각합니다. 따라서 이 트릭과 많은 스텝을 활용하면 프롬프트를 짧게 유지하면서도 매우 풍부한 프롬프트를 구축할 수 있습니다.
참고: 위 프롬프트는 SD가 매우 적은 색상으로 장면을 그리되, 일부 영역은 매우 선명한 색으로 강조하도록 유도합니다(예: 회색조 이미지에서 인물의 머리카락이나 옷 일부만 선명한 색으로 표현됨). 반대로, 전체 이미지를 색상으로 채우고 일부 영역만 회색조로 만드는 방식으로 이 효과를 뒤집을 수도 있습니다.[Audrey Hepburn : Milla Jovovich : 16] — Automatic1111의 XYZ 플롯 스크립트를 사용해 한 얼굴에서 다른 얼굴로 부드럽게 전환하는 재미를 즐길 수 있습니다. 이 특정 시간적 트릭은 얼굴/신체 표현에서 가장 현실적이고 정확한 해부학적 구조를 생성하는 데 도움이 됩니다. 이 트릭을 이용해 동적 LoRa 가중치를 구현할 수도 있다고 생각합니다. LoRa에 트리거 단어가 없다면, [ <lora: ...:0.42> : <lora: ...:0.99> : 16]처럼 LoRa 토큰을 직접 사용하거나, 여러 LoRa의 중첩된 "트리거 단어"를 사용할 수 있습니다.
"shot on %Brand Name% %Lens Mark Name% vintage lens" — SD가 기억하는 빈티지 렌즈 이름을 찾으면, 사진의 "아날로그 스타일"을 향상시킬 수 있습니다. 저는 "Carl Zeiss Sonar", "Nokton", "Helios 44-2"를 사용해왔지만, 각 렌즈 모델이 고유한 효과를 준다는 것을 확정지을 수는 없습니다. 자신만의 확인된 렌즈 목록이 있다면, 이 모델의 댓글에 커뮤니티와 공유해 주세요. [%PICTURE OF LEELOO saying HELP%]
향후, 아름다운 빈티지 렌즈로 촬영된 많은 이미지를 포함하는 학습 데이터셋을 구축하여 이 모델에 오래된 사진의 정신을 불어넣을 계획입니다. 이를 위해 고유한 트리거 단어를 사용하거나 "vintage lens"라는 표현을 사용할 계획입니다(아직 확정되지 않음).
"perfect anatomy", "anatomically correct body", "anatomically correct hand", "perfect hands", "anatomically correct fingers", "perfect limbs anatomy"와 같은 해부학적 표현을 사용하면 정확한 해부학을 얻을 확률이 높아집니다.
"smooth bokeh", "swirly bokeh", "depth of field", "smooth background" 등의 단어를 사용해 메인 피사체와 배경 간의 분리도를 높이세요.
"turbulent fog", "mist", "haze"를 "mystical lighting"과 함께 사용하면 장면의 깊이가 뚜렷한 분위기 있는 이미지를 얻을 수 있습니다. 차가운 아침 분위기를 원한다면 "early morning"과 "blue hour"라는 표현도 사용하세요.
"scary face expression", "surprised expression", "inviting expression", "lustful face" 등을 사용하면 얼굴의 감정 표정과 명확한 "바디 랭귀지"를 얻을 확률이 높아집니다. 효과는 있지만 아직 완전히 뚜렷하지는 않습니다.
이 모델의 우선순위
여성 캐릭터의 영화적인 사진적 사실성(SFW, 소프트코어 NSFW)
자연스러운 신체, 피부 텍스처, [향상 중] 환경(흙, 먼지, 바닥의 물건, 레트로 가구 및 장치)
현실적인 광학/사진 효과(부드러운 와일드 보케, 아날로그 필름 그레인, 왜곡 [제작 중]) — 빈티지 렌즈(Carl Zeiss Sonar, Jupiter 37a, Helios 44-2)
[향상 중] 도시 탐험(Urbex), 버려진, 쇠퇴한 실내, 우울한 분위기, 흐린 색상, 안개, 서림
제작 과정
이 모델은 Analog Madness, URPM, Cyber Realistic, epiCRealism, ICBINP, Cine Diffusion을 0.18~0.35의 계수로 병합하여 만들었습니다.
비슷한 특징(영화적 분위기, 대기감, 매력적인 해부학, 소프트코어/에로, 레트로 실내, 아침 야외 등)을 가진 신중하게 선별된 예술 사진 두 개의 데이터셋으로 학습했습니다. 데이터셋 총 이미지 수: 600~700장.
Kohya_SS를 사용해 각 이미지당 20스텝으로 LoRa로 학습한 후, 위 체크포인트들의 병합체에 약 0.3의 계수로 병합했습니다. 효과를 극대화하려면 동일한 이름의 LoRa와 함께 사용하는 것이 좋습니다.
향후 개선 계획
우선순위별로:
[완료] 손과 손가락 생성 개선/수정
[진행 중] 음울함, 보케, 색수차, 구면수차, 빛 새어나옴, 오래된 아날로그 필름 효과 개선
발과 발가락 생성 수정/개선
[진행 중] 더 많은 Urbex, 폐허, 파괴된 실내, 잊혀진/사라진 야외 풍경 추가 (좋은 데이터셋 추천해 주세요 ;)
눈과 해부학의 세부 조정/개선
피드백 환영합니다...
















