Analog Film Photography portraits

세부 정보

파일 다운로드

모델 설명

아날로그 필름 초상화 LoRA

내용: 사용 방법 - 트리거 단어 - 훈련 - 미래

초상 사진 생성 시 진짜 필름 같은 감성을 얻는 것은 매우 어려웠습니다. 많은 모델은 색을 과도하게 띄우거나 기본적으로 이미지를 과노출시킵니다. 그래서 저는 SD 1.5 모델과 함께 사용할 수 있도록 LoRA를 자체 훈련시켰습니다. 이 LoRA는 생성물에 일반적인 필름처럼 미세한 필름 입자/노이즈를 부여할 수 있으며, 필름 특유의 높은 다이내믹 레인지까지 재현할 수 있습니다. SD를 사용해 초상화를 만들 경우 왜 종종 밝고 과노출된 모습을 띠는지 아래에서 더 자세히 설명드리겠습니다.

사용 방법:

LoRA 강도: 0.3에서 0.7 사이 - 강도가 높을 경우 아티팩트가 발생할 수 있음

모든 포토리얼리스틱 모델에 대해 초상화에 잘 작동합니다 (훈련 참고). 샘플 이미지들은 Realistic Vision V1.4로 제작되었습니다. 다른 몇몇 모델에서도 테스트해보았고 잘 작동함. 약간 과도하게 훈련된 편이므로, 높은 강도는 권장하지 않음. 이후 수정할 예정입니다.

이 LoRA는 얼굴의 형태, 배경, 전체 이미지의 느낌을 변화시킬 수 있으며, 동일한 시드 값에서도 크게 다른 결과를 낼 수 있습니다. 이는 훈련 방식에서 비롯된 현상입니다.

특정 이미지를 재생성하고 싶다면, Control Net과 기타 도구를 사용하는 것이 매우 권장됩니다.

특정 유형의 사람을 생성할 때는 설명을 구체적으로 하세요: “큰 후드티를 입은 라틴 여성” – “파란 머리의 아시아 남성”처럼요. 그렇지 않으면 비슷해 보이는 얼굴이 자주 나오게 됩니다.

이 LoRA는 NSFW 생성을 위한 테스트나 목적은 아닙니다.

트리거 단어:

필름 - 아날로그 필름

트리거 단어 없이도 작동하지만, 추가 프롬프트를 넣으면 효과가 더 커집니다. 또한 다음과 같은 프롬프트와도 잘 어울립니다: 석양 - 강한 빛 - 부드러운 빛 등.

훈련:

이 LoRA는 다양한 컬러 필름 종류로 촬영된 약 30장의 초상화를 기반으로 훈련되었습니다. 훈련 데이터에는 다양한 인종, 성별, 나이가 포함되어 있어 어떤 모델이나 사람에게도 적용 가능하도록 균형을 맞추려 노력했습니다. 이 LoRA는 얼굴 표현에 특히 뛰어나지만, 강도가 높을 경우 건물이나 적절하지 않은 장소에 표시되지 않은 다양한 아티팩트나 물체를 삽입하는 경향이 있습니다. 이는 태깅 시 부주의함에서 비롯된 것으로, 향후 개선할 계획입니다. 최상의 초상화를 낼 수 있도록 하면서도 특정 얼굴 형태나 물체에 대한 편향을 가능한 한 줄이려고 노력할 것입니다. 약 3500스텝에 걸쳐 좀 과도하게 훈련된 편이므로, 생성 시 LoRA 강도를 낮춰 줄 수 있다면 문제가 해결될 수 있습니다.

LoRA 훈련에 대한 보다 자세한 정보는 아래 유튜브 채널과 동영상을 참고하세요:

https://www.youtube.com/@Aitrepreneur

미래 계획:

아날로그 필름 초상화 v1.1: 더 방대한 데이터셋과 개선된 태그로 훈련. 보다 완화된 훈련 방식 적용.

네온 조명 v1.0: 사진작가들은 종종 "네온" 감각을 내기 위해 컬러 겔이나 색조 빛을 사용합니다. 그러나 SD는 이 부분에서 매우 부족하며, 종종 과노출되거나 무작위로 네온 목걸이나 의류를 추가합니다. 이미 베타 버전을 훈련시켜 매우 우수한 효과를 재현할 수 있음을 확인하였습니다. 예시 이미지 보기: https://unsplash.com/photos/3TLl_97HNJo

아날로그 필름 풍경 v0.5: 포트레이트가 아닌 다양한 필름 종류의 영상 데이터셋에 기반한 LoRA 훈련으로, 이미지 생성 시 더 큰 유연성을 제공할 예정입니다.

렌브란트 조명 v0.5: SD에서 프롬프트로 이와 같은 조명을 구현하는 것은 매우 어렵습니다. 중간 규모의 데이터셋을 기반으로 유명한 드라마틱한 포트레이트 조명 스타일을 재현하려고 시도할 예정입니다.

슬라이드 필름 v0.5: 슬라이드 필름은 분명한 색조 스타일과 입자 구조를 지니고 있어 디지털로 재현하는 데 항상 어려움이 있었습니다. 과정을 거쳐 베타 테스트를 진행해나갈 예정입니다.

스트리트 사진 v0.5: 주로 광각 렌즈를 사용하고 다양한 주제에 대해 촬영됩니다. 이를 재현하려고 시도할 예정입니다.

스튜디오 패션 사진 v0.5: 패션 사진작가는 특정 스타일/각도/초점 길이로 사진을 찍으며, 얼굴보다 의류를 강조하려는 부드러운 조명을 사용합니다. 다양한 스타일에서 학습을 진행할 예정입니다.

왜 이 필름 LoRA를 만들었나요?:

SD는 매우 많은 이미지에 대해 훈련되었습니다. LAION 데이터베이스에서 “초상 사진”을 간단히 검색해보면, 대부분의 이미지들이 오래된, 낮은 품질이며 과노출된 것을 확인할 수 있습니다. 스타일에 관한 태깅도 대부분 매우 부정확합니다. “필름 사진”을 검색하면 로고나 포스터가 끼어든 매우 나쁜 예시들이 나옵니다. SD는 특정 사진 스타일, 특히 전문적인 수준의 사진스스에 대해 충분한 데이터셋을 갖추고 있지 않습니다. 저는 사진 생성을 원하는 사진작가들이 원하는 레이어를 달성할 수 있도록 도와주기 위해 이 작업을 시도하고 있습니다.

피드백은 매우 환영합니다. 어떤 부분이 잘 되었는지, 어떤 부분이 안 되었는지 댓글로 남겨주세요. 이는 미래 LoRA 훈련에 큰 도움이 될 것입니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.