CineVision 2.3.0 공개 릴리즈 노트
안녕하세요, 이 버전은 약 한 달 반 동안 준비되어 왔으며, 여러 차례의 테스트 수정과 다중 레이어의 훈련을 거쳤습니다. 총합으로 CineVision은 약 9,000장의 훈련 이미지를 기반으로 약 12만 회의 훈련을 받았습니다. CineVision은 영화 중심의 모델로, 기본적으로 영화적 사실주의 스타일을 출력합니다. 다양한 영화적 스타일, 용어 및 장면 구성에 매우 민감하게 반응합니다. 프롬프트에 대해 매우 일관되고 반응성이 뛰어나, 아래 예시 이미지처럼 자연어 프롬프팅을 사용할 때 가장 잘 작동합니다.
이름과는 달리 CineVision은 실제로 매우 다재다능한 모델입니다. 사진, 만화, 영화, 이상한 낙서, 색칠공부 책 등 무엇이든 생성할 수 있습니다.
SD3가 곧 출시될 예정이므로, 이 버전은 아마도 이 모델(및 곧 출시될 '최종 XL 버전'을 갖춘 제 다른 모델들)에 대한 마지막 대규모 SDXL 업데이트가 될 것입니다. 저는 이 모델을 매일 사용하며, 다른 새로운 모델들이 출시되더라도 여전히 저의 주력 모델입니다. 또한 라이트닝 버전도 제공할 예정이며, 새롭게 출시된 Hyper LoRAs와도 매우 잘 작동합니다(몇 가지 샘플에 이미 적용했지만, Hyper는 CFG에 약간 과도할 수 있습니다).
손과 중거리 객체는 이제 매우 향상되었습니다. 특히 SAG 또는 PAG(또는 둘 다)를 사용할 때 더욱 좋습니다.
2024년 4월 25일 변경 사항
수천 장의 훈련 이미지에 대해 약 12만 스텝 총 훈련을 5회 수행했습니다.
3,000장의 영화 스틸 이미지를 수동으로 선정하여 Ultrasharp로 업스케일링하여 최대 길이가 1,024~2,048 사이가 되도록 조정했습니다.
사진 데이터셋에서 2,000장의 이미지
LAiON-POP 데이터셋에서 2,000장의 이미지
1,600장의 MJ 아트 스타일 데이터셋(자체 라이브러리에서 수동 선정)
해부학 훈련 이미지 350장
모든 캡션은 GPTV/LLaVA-1.6로 생성했습니다.
알려진 문제점
남성 생식기의 생성 품질은 많이 개선되었지만(말장난 아님) 여전히 자연스러운 음경 생성에는 어려움이 있습니다. 정확한 남성 해부학을 원하신다면 LoRA와 인페인팅을 사용하는 것이 가장 좋습니다.
일부 영화 스타일에서 흐릿한 효과가 나타날 수 있습니다. 이는 초기에 24FPS 콘텐츠로 훈련되었기 때문입니다. 현재는 대부분 해결되었으나, 50년대 테크니컬러 스타일과 같은 고전적인 아날로그 영화 룩을 극단적으로 추구할 경우 여전히 나타날 수 있습니다.
참고 - 이 버전의 모든 샘플 이미지는 Perturbed Attention Guidance (PAG), FreeU, self attention guidance, latent modifier, DynamicThresholding를 사용했습니다. PAG를 제외한 모든 기능은 ForgeUI에 내장되어 있으며, A1111보다 강력히 추천드립니다.