Animated Character in Real Photo

세부 정보

모델 설명

프롬프트 형식:

실사 사진 속 애니메이션 캐릭터, { 플랫 셰이딩 | 리얼리스틱 } 애니메이션 스타일로 그려진 젊은 애니메이션 스타일 { 소녀 | 여성 | 소년 | 남성 }, { your prompt }

기타 태그:

프레임링:

  • 풀 렝스, 미디엄 샷, 미디엄 클로즈 샷, 클로즈업, 와이드 앵글

품질:

  • 과노출, 흐릿함, 저해상도, 필름 그레인, 비네팅, JPEG 아티팩트

권장 강도: 0.6 <-> 1.0

3D 애니메이션 캐릭터를 실생활 환경과 상황에 묘사한 이미지를 추가하고 싶습니다. 이 내용을 지금까지 읽으셨고 접근 권한을 제공하거나 좋은 소스를 알고 계시다면, 댓글이나 DM으로 알려주세요. :)

두 모델을 각각 3000스텝과 1500스텝에서 업로드했습니다. 둘 다 우수하며 작동 방식이 충분히 다릅니다.

이것은 Z-Image-Base 모델 출시 전 테스트 학습입니다. Chroma에 대해서도 학습을 진행하고 싶습니다.

학습 세부 정보:

단일 RTX 4090에서 ai-toolkit(커밋 <2d30dc5d>)을 사용해 학습.

배치 크기 10, 해상도 512. DOP는 대상이 "사진"이 되도록 설정.

전체 학습 설정은 학습 데이터 섹션에 업로드할 예정입니다.

데이터셋:

"애니메이션을 실생활에 표현한" 개념을 담은 135장의 수동으로 수집 및 선별된 데이터셋으로 학습.

이미지의 약 절반은 DanBooru에서 "photo background" 및 "anime in real life" 태그가 붙은 이미지.

나머지 절반은 www.joyreactor.cc의 "Тульпа" 태그 또는 Yandex에서 "anime in real life"로 이미지 검색한 결과에서 가져왔습니다.

캡셔닝:

데이터셋의 이미지들은 JoyCaption 베타로 캡셔닝한 후 수동으로 정리했습니다.

데이터셋 내 캐릭터가 리얼리스틱/반리얼리스틱 조명으로 표현된 이미지는 "drawn in realistic anime style"로 태그했습니다. (54장)

데이터셋 내 캐릭터가 매우 평평한 조명 또는 두꺼운 만화 윤곽선을 가진 이미지는 "drawn in flat lighting anime style"로 태그했습니다. (74장)

이 태그는 주관적이므로 일관성이 떨어질 수 있으며, 향후 개선이 필요합니다.

초고화질 이미지를 찾기 어려웠기 때문에, 모델은 2D 일본 일러스트 스타일이나 배경 위에 겹쳐진 캐릭터에 편향될 수 있습니다.

대부분의 워터마크가 있는 이미지는 그대로 유지하고 해당 태그를 부여했습니다. 제 지식 범위 내에서 캡션에 캐릭터 이름이나 프랜차이즈 이름은 포함되지 않았습니다.

데이터셋의 많은 이미지가 러시아 어느 곳에서 촬영된 것으로 보이므로, 해당 경우 "It appears to be somewhere in Russia." 태그를 추가했습니다. 모델은 여전히 이러한 배경 설정에 편향될 수 있습니다.

데이터셋의 이미지 99%는 SFW입니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.