Head POV - Point of view from the back of the head - Camera over the shoulders - Animal Perspective
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
SDXL로는 제대로 구현할 수 없었던 단순한 개념입니다.
권장 가중치: 0.85 / 0.6에서 1.3까지 잘 작동합니다.
인간뿐 아니라 물체에도 잘 일반화됩니다. 시도해보세요.
트리거 키워드:
a photo shot in the point of view from the back of a SUBJECT's head
보조 프롬프트:
on the lower side, cropped, looking at___, ears, bokeh, dof, blur
부정적 보조 프롬프트:
mouth, nose, eyes, facing the camera, bokeh, dof, blur
데이터셋은 작았고 동물과 자전거 1~2대만 포함되어 있었기 때문에 뱀, 타조, 돼지, 거북이 같은 일부 동물은 회전하기 어렵습니다.
저는 에포크 18을 선택했지만, 일부 주체에는 더 훈련된 에포크(예: 24, 40)가 더 나은 결과를 냈습니다. 하지만 그 대신 오류도 증가했습니다. 따라서 제 판단으로 이 에포크 18이 가장 최적입니다. 원하시는 분을 위해 더 훈련된 에포크를 업로드할 수도 있습니다.
예를 들어, 이 에포크에서는 피카츄의 빨간 뺨이 항상 잘못 보입니다. 에포크 24와 40에서는 피카츄가 매우 잘 표현됩니다. 쥐의 귀도 에포크 18에서는 잘못된 방향을 바라보는 것처럼 보이지만, 에포크 40에서는 정확히 보입니다.
이것은 "POV", "어깨 너머로 찍힌 장면"이지만, 훈련 시에 정확히 그 단어를 사용하지 않고 "point of view"를 사용했습니다. 따라서 그 단어들이 도움이 되는지 확신할 수 없습니다.
이미지가 화면 전체를 차지할 수 있으므로, 하단 부분만 원하신다면 Regional Prompter를 사용하시기를 권장합니다. 매우 훌륭하게 작동합니다. 또한 다른 캐릭터 LoRA와 함께 사용할 경우에도 Regional Prompter를 사용해야 변형이 일어나지 않습니다.
앞으로 데이터셋을 확장하고, 위치(오른쪽, 왼쪽, 아래, 위)를 캡션으로 추가할 계획입니다. 하지만 현재는 그렇지 않으므로, 그런 기능은 작동하지 않습니다.
기타 파라미터 및 설정:
기본 체크포인트는 “sdXL_v10VAEFix”(6.7GB)입니다. 따라서 어떤 체크포인트와도 매우 유연하게 작동합니다.
현재 추천하는 체크포인트는 juggernautXL_v8Rundiffusion과 juggerxlInpaint_juggerInpaintV8입니다(인페인팅용).
조명 모델은 매우 잘 작동합니다! Dreamshaper SDXL을 추천합니다.
저는 6단계에 DPM++ 2S a Karras, CFG 2.2, 고해상도 5단계, denoise 0.45, 해상도 1.5배를 선호합니다. 하지만 기본값은 DPM++ SDE Karras, CFG 2, 4단계입니다.
새로운 Juggernaut 조명 모델도 훌륭할 것 같습니다.
표준 생성 시:
CFG: 5.5
DPM++ 3M Exponential (50단계 이상)
DPM++ 2M Karras (25단계 이상)
DPM++ SDE Karras
DPM++ 2S a Karras
Loractl은 복잡한 프롬프트, 주체 또는 다른 LoRA를 사용할 때 매우 잘 작동합니다. 초기에 높은 가중치로 시작한 후 점차 낮추는 방식을 추천합니다. 예:
<LoraName:[email protected],[email protected]>
재미를 원하시나요? 와일드카드 동적 프롬프트 확장 프로그램 https://github.com/adieyal/sd-dynamic-prompts와 제 common_animals.txt 파일을 \extensions\sd-dynamic-prompts\wildcards 폴더에 설치하세요. 아래는 테스트용으로 만든 프롬프트입니다. 프롬프트 창에 붙여넣으세요:
a photo shot in the point of view from the back of a __common_animals__'s head close-up, on __YetAnotherWildcardCollection-main/Background/Environment__<lora:HeadPOV_from_behind_vk1-000018:0.85>
현재 LoRA의 문제점:
많은 동물들을 제대로 회전시키지 못함 — 더 많은 데이터 필요
때때로 두 개의 뿔, 이상한 귀와 눈, 귀가 카메라를 바라보는 등의 오류 발생
추가 설정: 1024 해상도로 훈련, CogVL 및 taggui-v1.15.0-windows를 사용해 61개의 이미지 캡션 생성. 총 44개의 에포크 중 18번째 에포크 사용. 현재 프로디지 1.0. "Pose" 개념을 위한 2단계 폴더. 일정한 BATCH 2, 랭크 16/1, Scale weight norms 1, snr gamma 5, Noise offset 0.0357, 정규화 이미지 없음
결과와 의견을 남겨주시면 감사하겠습니다. 어떤 아이디어라도 환영합니다. 감사합니다.




















