The Wire: Baltimore Photography
세부 정보
파일 다운로드
모델 설명
V1.1에서 데이터셋 태그가 완전히 최적화되었으며, 시즌 1부터 시즌 5까지의 차이가 구분됩니다.
1.0의 태그가 너무 포괄적이었고, 1.1에서는 시즌 1부터 시즌 5까지의 태그를 체계적으로 최적화했습니다
이 LoRA 모델은 HBO의 고전 시리즈 『The Wire』의 고유한 시각적 스타일을 재현하는 데 전념합니다. 이 모델은 드라마의 특징적인 다큐멘터리 스타일 촬영 기법, 저 포화도 색상 팔레트, 독특한 볼티모어 도시 풍경을 학습합니다. 모델은 볼티모어의 상징적인 붉은 벽돌 연결주택, 낡은 골목길, 잔인한 도시 분위기로 가득 찬 거리 풍경을 성공적으로 포착합니다.
이 LoRA 모델은 HBO 고전 드라마 『The Wire』의 고유한 시각적 스타일을 재현하는 데 목적을 둡니다. 다큐멘터리 같은 촬영 감각, 저 포화도의 색조, 독특한 거리 구도 및 빛과 그림자의 분위기를 학습하였습니다. 모델은 볼티모어의 상징적인 붉은 벽돌 연결주택, 허름한 골목길, 거리 분위기가 가득한 장면들을 성공적으로 재현했습니다.
제공된 미리보기 이미지는 유사한 결과를 얻기 위한 좋은 참고 자료가 될 수 있는 특정 프롬프트를 사용해 생성되었습니다. (예시 프롬프트는 학습 데이터의 txt 파일도 참고할 수 있습니다)
프롬프트는 미리보기 이미지 또는 학습 데이터의 txt 파일을 참고하세요.
이 LoRA 모델 학습 시의 도전 과제
데이터셋 선택: 볼티모어의 이야기는 그 도시의 사람들과 분리될 수 없지만, 『The Wire』의 고유한 서사적 감각을 포착하기 위해 주요 등장인물은 의도적으로 배제했습니다. 따라서 인물이 포함된 이미지들은 대부분 배경 인파로 구성되어 있으며, 개인과 도시 건축물 간의 상호작용을 중심으로 드라마의 독특한 영상 스타일을 모방합니다.
학습 해상도: 일관된 스타일을 가진 140장의 서로 다른 주제 이미지들이 수렴하도록 하는 데 처음에는 어려움을 겪었습니다. 처음 1024 해상도로 시도했을 때 기초적인 건축 스타일만 학습할 수 있었습니다. GitHub에서 유사한 사례(Flux Lora training seems not to converge with big dataset(140 images))를 찾았고, 다른 사용자는 1024 해상도에서 4x4x3500 스텝을 필요로 했습니다. 따라서 저는 512 해상도로 학습을 선택하고 약 10,000 스텝을 학습하여 원하는 결과를 얻었습니다.
이 LoRA 모델 학습 시의 도전 과제:
데이터셋 선택 과정에서 주요 등장인물을 가능한 한 배제했지만, 이 도시의 이야기에서 사람들은 필수적인 요소입니다. 따라서 인물이 포함된 이미지들은 대부분 배경 인파로 구성되었으며, 사람과 오래된 도시 건축물 간의 상호작용을 통해 『The Wire』 고유의 시각적 서사 방식을 효과적으로 모방합니다.
학습 과정에서 140장의 다양한 주제 이미지들이 수렴되지 않는 어려움을 겪었습니다. 처음 1024 해상도로 학습했을 때 기초적인 건축 스타일만 학습할 수 있었고, GitHub에서 유사한 사례(Flux Lora training seems not to converge with big dataset(140 images))를 찾아보았습니다. 다른 사용자는 1024 해상도에서 4x4x3500 스텝이 필요하다고 보고했고, 결국 저는 512 해상도로 약 10,000 스텝을 학습하여 원하는 결과를 얻었습니다.



















