Judy Hopps

세부 정보

파일 다운로드

모델 설명

v2.0

원본 영화에서 추출한 869개의 크롭 이미지에 Danbooru 스타일 태그를 적용하여 학습되었습니다.

12회 반복, 10에포크, 배치 크기 12 — 총 869×12×10/12=8,690스텝.

모델이 이미 알고 있는 캐릭터 정보와 제 데이터가 혼합되는 것을 방지하기 위해, 트리거 단어로 독특한 'jdhpps' 토큰을 사용하기로 결정했습니다. 처음에는 'Judy Hopps'를 시도해봤지만, 모델이 이미 학습한 내용을 재학습하는 것이 매우 어렵다는 것을 확인했습니다.

LoRA는 영화에 등장하는 모든 캐릭터 복장을 지원합니다:

  • 파란색 바디수트, ZPD 엠블렘 (어깨 노출)

  • 정복, 넥타이, 어깨 줄, 유틸리티 벨트

  • 캐주얼 복장, 회색 티셔츠, 브라 스트랩, 진한 회색 바지

  • 경찰 복장, ZPD 배지, 유틸리티 벨트

  • 주차 요원 복장, 주황색 조끼, 여성 경찰 모자

  • 농부 복장, 체크 셔츠, 소매 걷어 올린, 농막 모자, 청바지

기본 음성 프롬프트:

흐릿함, 최저 품질, 나쁜 품질, 저해상도, 비정상적인 형태, 변형됨

LoRA는 다음도 지원합니다:

귀 위로, 귀 아래로, 토끼 치아, 눈 반사광, 눈 반사, 눈에 반사된 빛, 당근 펜 들고 있음, 파일 들고 있음, 메모장 들고 있음, 사진 들고 있음

그리고 Danbooru 스타일로 표현된 영화의 모든 감정을 포함합니다:

:3, :<, :/, :d, :o

기본 이미지로는 다음을 추천합니다:

  • euler_ancestral(euler a) 샘플러

  • karras 스케줄러

  • 20스텝

  • cfgScale 7

그 후 hi-res fix(img2img)를 다음과 같이 실행하세요:

  • dmpp_2m(DPM++ 2M) 샘플러

  • karras 스케줄러

  • 0.45–0.5 디노이즈

  • 20–35스텝

  • cfgScale 6

저는 LoRA 강도를 0.7–0.8로 추천합니다(더 높은 값은 아티팩트와 유사한 배경을 생성할 수 있음), 그러나 여러분에게 가장 적합한 값을 자유롭게 찾아보세요!

/model/3671?modelVersionId=1876492에서 학습되었으며, 이 모델 사용을 추천합니다.

아트를 공유해 주시고, 꼭 리뷰를 남겨주세요!

v1.0

원본 영화에서 추출한 877개의 크롭 이미지에 Danbooru 스타일 태그를 적용하여 학습되었습니다.

18회 반복, 2에포크, 배치 크기 10 — 총 877×18×2/10=3,158스텝.

모델이 이미 알고 있는 캐릭터 정보와 제 데이터가 혼합되는 것을 방지하기 위해, 트리거 단어로 독특한 'jdhpps' 토큰을 사용하기로 결정했습니다. 처음에는 'Judy Hopps'를 시도해봤지만, 모델이 이미 학습한 내용을 재학습하는 것이 매우 어렵다는 것을 확인했습니다.

LoRA는 영화에 등장하는 모든 캐릭터 복장을 지원합니다:

  • 파란색 바디수트 (어깨 노출, 이톤 바디수트, 진한 바지)

  • 정복, 넥타이, 어깨 줄, 유틸리티 벨트

  • 캐주얼 복장, 회색 티셔츠, 진한 회색 바지, 브라 스트랩, 손목시계(팔찌)

  • 경찰 복장, ZPD 배지, 유틸리티 벨트 (손 패드, 무릎 패드)

  • 주차 요원 복장, 주황색 조끼, 여성 경찰 모자 (귀 아래, 손 패드, 무릎 패드)

  • 농부 복장, 체크 셔츠, 소매 걷어 올린, 농막 모자, 청바지

더 나은 캐릭터 외형과 디테일을 위해 다음 태그를 추가하세요:

자세한 눈, 사실적인 눈, 보라색 눈, 큰 눈, 큰 귀, 자세한 털, 누런 털, 이톤 털, 날카로운 털, 자세한 질감, 여자 토끼, 앤트로, 4개의 손가락

현실적인 조명과 영화 정확한 스타일을 위해 다음 태그를 추가하세요:

new, 4k, 최고 품질, 고화질, 걸작, 디테일한, 사실적인, 사진실감, HDR, 고대비, 화려한 색상, 영화적 조명, 볼륨 라이팅

기본 음성 프롬프트:

눈 반사, 눈에 반사된 빛, 비정상적인 해부학, 변형된 홍채, 과도한 반짝임, 저대비, 흐릿함, 과도한 채도, 최저 품질, 나쁜 품질, 비정상적인 형태, 변형됨, 나쁜 눈, 흐릿한 눈, 만화, 애니메이션, 2D, 평면, 디테일 부족, 단순함, 퍼리, 인간, 텍스트, 아티스트 이름, 작음, 짧음

LoRA는 다음도 지원합니다:

귀 위로, 귀 아래로, 토끼 치아, 눈 반사(눈에 반사된 빛), 눈에 반사광, 당근 펜 들고 있음, 파일 들고 있음, 메모장 들고 있음, 사진 들고 있음

그리고 Danbooru 스타일로 표현된 영화의 모든 감정을 포함합니다:

:3, :<, :/, :d, :o

hi-res fix 없이 DPM++ 2M Karras(샘플러 dmpp_2m, 스케줄러 karras)를 사용하세요.

hi-res fix 사용 시 euler a Karras(샘플러 euler_ancestral, 스케줄러 karras)를 사용하고, DPM++ 2M Karras로 디노이즈 0.3~0.6 범위로 적용하세요(더 선명하고 사실적인 효과 추가). euler a Karras는 눈, 치아, 옷에 훨씬 뛰어나지만 털은 부드럽고 디테일이 덜 나타납니다.

실제로 양쪽 모두 DPM++ 2M Karras를 사용할 수는 있으나 눈에 반사광이 왜곡될 수 있습니다. hi-res fix로 수정될 수도 있고 안 될 수도 있으니 참고하세요. 하지만 이미지의 디테일은 분명히 더 풍부해집니다.

저는 LoRA 강도를 0.8–0.85로 추천하지만, 여러분에게 가장 적합한 값을 자유롭게 찾아보세요!

/model/3671?modelVersionId=1876492에서 학습되었으며, 이 모델 사용을 추천합니다.

아트를 공유해 주시고, 꼭 리뷰를 남겨주세요!

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.