Fixed Perspective View
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
이 LoRA의 원본 출처는 CivitAI입니다. (civitai.com/user/worgman). 이는 무료로 다운로드할 수 있으며, 다른 곳에 게시되어서는 안 됩니다.
이것은 카메라 각도를 조작하기 위한 개념 LoRA입니다. 이미지의 고정된 시점 촬영을 제공합니다. NSFW 콘텐츠를 목적으로 하지만, 이에만 제한되지는 않습니다. 이 도구로 누구나 어떤 결과를 만들어내는지 보고 싶으므로 아래에 사진을 게시해 주세요.
Adetailer와 작은 영역의 인페인팅은 카메라 각도 조작에 집중하는 저의 시점 LoRA와 잘 호환되지 않습니다. 이 문제를 완화하기 위해 LoRA를 비활성화하거나 가중치를 크게 줄이며, 인페인팅 디노이즈를 낮추는 것을 권장합니다.
Adetailer 인페인팅 디노이즈를 0.25–0.30으로 설정하면 세부 정보는 약간 손실되지만 이 문제를 대부분 해결할 수 있습니다.
Spyview
이것은 고정 시점 LoRA의 보완 개념입니다. V1.0 기준으로 고정 시점 V1–V3와 완전히 별개입니다. 향후 변경될 수도 있지만, 현재 계획은 두 개념을 분리한 채 이 페이지에서 각각 업데이트를 지속하는 것입니다. 둘 다 카메라 조작 LoRA이기 때문입니다.
Spyview V1 버전부터 스타일 영향력이 줄어들었고, 전경에 어떤 요소를 프롬프트로 지정할 수 있는 범위가 더 다양해졌습니다. 그러나 V1은 여전히 완벽하지 않습니다. LoRA에 너무 많은 유연성을 부여했기 때문에 가끔 나쁜 결과가 나옵니다. 좋은 프롬프트 작성으로 이를 방지할 수 있습니다.
“화면 밖” 태그를 사용하면 이미지의 대상이 카메라에서 얼마나 멀리 떨어져 있는지를 어느 정도 제어할 수 있습니다. 대상의 상당 부분이 화면 밖에 있다고 지정하면 LoRA는 대상을 전경으로 더 가깝게 가져옵니다. 반대로, 프롬프트에 “전신”이라고 지정하면 LoRA는 전체 이미지를 출력해야 하므로 대상이 더 멀리 떨어져 보입니다.
V1이 잘 하는 점은 무엇인가?
- 저의 다른 V1 LoRA와 비교해 스타일 영향이 매우 낮음.
- 매우 유연함
- 전경에 여러 항목을 조합해 프롬프트로 지정할 수 있음. 모든 조합이 작동하는 것은 아니지만, 실험해 보면 흥미로운 조합을 찾을 수 있음.
V1이 보통 하는 점은 무엇인가?
- 다양한 트리거 단어는 대체로 서로 구분되지만 일부 중복이 있음.
- 슬라이딩 도어와 도어 전경 사이에 상당한 중복이 있음.
- 도어 전경이 다른 개념을 압도하는 경향이 있음.
- 창문 전경은 개선이 필요함. 실내/실외에서 바라보는 제어를 너무 많이 넣으려 했고, 이 때문에 문제가 발생함.
- 도어의 재질(예: 유리 도어 전경)을 프롬프트로 지정하면 실제로 작동함. 학습 데이터셋에 유리 도어 이미지가 전혀 없었음에도 불구하고요. 이 방향을 계속 확장해 LoRA에 이런 유연성을 추가하고 싶습니다. 향후 어떻게 될지 지켜보겠습니다.
V1이 실패하는 점은 무엇인가?
- LoRA가 프롬프트 작성자의 의도를 정확히 반영하는 능력이 낮음. 프롬프트 내 특정 태그가 출력 이미지에 극심한 변이를 일으킴. 이는 유연성에는 좋지만 특정 아이디어의 재현성에는 좋지 않음. 이 버전으로 테스트하는 것이 매우 어려웠는데, 프롬프트로 예상했던 이미지가 아닐 때가 많았음.
- 일부 개념 태그가 너무 희석되어 잘 작동하지 않음. 오브젝트 전경은 전체 데이터셋의 약 3%에 불과하므로, 이를 사용해 좋은 결과를 기대하지 마세요.
- 전경에 놓이는 ‘구조’는 프롬프트에 따라 의미가 없음. 도어 전경은 비현실적인 각도로 도어를 보이거나, 벽과 도어 각각에 문고리나 문손잡이가 여러 개 나타나는 경우가 많음.
- 열쇠구멍 전경은 모델이 이미지에 열쇠구멍을 삽입하게 만듦. 이 문제를 해결하려면 트리거 단어를 변경해야 합니다. 열쇠구멍은 일반적으로 구멍 위쪽 끝에 나타나거나, 대상 위에 놓입니다. 불편하네요. 테스트 중 약 40%는 괜찮았지만, 문제가 생긴 경우 출력이 망가졌습니다. 부정적 프롬프트에 “열쇠구멍”을 넣으면 어느 정도 도움이 됩니다.
고정 시점 보기
V1
저의 첫 번째 개념 LoRA 시도이며, 이전부터 관련 이미지를 모으고 있던 프로젝트입니다. 충분한 양의 이미지를 모았다고 판단해 시도해 본 결과가 이 것입니다. 향후 업데이트를 위해 더 많은 이미지를 수집해야 합니다. 우수한 출력을 위해서는 ADetailer와 HiResFix가 필요합니다. 여러 대상을 프롬프트로 지정할 경우, 인페인팅을 통해 결과를 수정해야 할 가능성이 높습니다.

V2
학습에 사용된 데이터셋의 크기를 확장하고, 일부 이미지를 분류하여 카메라를 더 정밀하게 조작할 수 있는 트리거 단어를 제공하려 시도했습니다. 사용한 이미지의 양이 방대하고 태그 정리 및 정제할 시간이 부족해 다소 거칠게 처리했습니다. 따라서 개선 여지가 있지만, 원하는 제어의 일부는 성공적으로 구현했습니다.


V3
V2나 V1만큼 출력에 스타일 영향을 주지 않도록 학습 데이터셋에서 일부 이미지를 제거하고 새로운 소스를 추가했습니다. 태그 가중치를 조정해 추가 제어를 시도했습니다. V3는 V2보다 절대적으로 우수하지는 않습니다.





















