XL realistic fursuit
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
이것은 매우 일반화된 동물복 LoRA로, 세 가지 일반적인 동물복 스타일(kemono fursuit, realistic fursuit, toony fursuit)을 학습했으며, 후면도 또는 머리만 그릴 수 있습니다. 일반화성과 원래 모델의 성능 향상을 위해 다른 여러 측면의 학습도 병행했습니다. 다운로드 시 작은 파일은 프롬프트 예시입니다.
LoRA는 Ratatoskr를 기반으로 학습되었으며, 이 모델은 다양한 스타일을 지원하기 때문입니다. 그러나 V8THL 이후 이 모델은 명백하게 과학습되어 색상이 비정상적이며 받아들이기 어렵습니다. 따라서 더 나은 색상과 배경 구조 표현이 필요하다면 이 버전을 사용하는 것이 좋습니다.
원래 모델의 효과를 향상시키기 위해 애니메이션 스타일, 두꺼운 코팅 스타일, 128px 픽셀 스타일, 단순한 페인팅 스타일, 가상과 현실 결합 등도 학습했으며, 시바견의 표현 효과 개선도 시도했습니다.
하지만 구체적인 개념에 할당할 수 있는 이미지가 많지 않아 일부 개념은 몇 장의 이미지로만 학습되었으며, 여러 번 시도해야 할 수도 있습니다. 다양성 학습은 과학습 현상을 개선하는 데 도움이 되며, 학습 대상이 아닌 분야에서도 더 나은 일반화 성능을 이끌어낼 수 있습니다.
추가적으로 캐릭터 '고양이 열세'(cat13), ori, 삼보(sanbao), 정범(jingfan)도 일부 학습했으나, 사용된 이미지가 많지 않았습니다. 이는 개념 간섭이 모델의 일반화 능력에 예기치 않게 영향을 미치는 것을 최소화하기 위한 조치이며, 캐릭터 학습 방식을 사용하지 않았습니다. 따라서 이 LoRA는 캐릭터 학습에 특화된 모델이 아니며, 특징 학습이 부족하여 성능이 좋지 않습니다.
LoRA 강도는 0.6에서 시작해 보는 것을 권장합니다. 낮은 값도 효과가 있을 수 있습니다. 일부 개념은 0.85처럼 더 높게 설정해야 할 수도 있으며, 1로 설정하면 이미지 품질이 명백히 저하됩니다. 일부 개념의 특징이 뚜렷하면 낮게 설정하는 것이 더 나을 수 있습니다.
자세한 설명 더 보기 (기계 번역, "Show More" 클릭하여 추가 지침 보기)
이것은 매우 일반화된 동물복 LoRA로, 세 가지 일반적인 동물복 스타일(kemono fursuit, realistic fursuit, toony fursuit)을 학습했으며, 후면도 또는 머리만 그릴 수 있습니다. 일반화성과 원래 모델의 성능 향상을 위해 다른 여러 측면의 학습도 병행했습니다. 다운로드 시 작은 파일은 프롬프트 예시입니다.
LoRA는 Ratatoskr를 기반으로 학습되었으며, 이 모델은 다양한 스타일을 지원하기 때문입니다. 그러나 V8THL 이후 이 모델은 명백하게 과학습되어 색상이 비정상적이며 받아들이기 어렵습니다. 따라서 더 나은 색상과 배경 구조 표현이 필요하다면 이 버전을 사용하는 것이 좋습니다.
원래 모델의 효과를 향상시키기 위해 애니메이션 스타일, 두꺼운 코팅 스타일, 128px 픽셀 스타일, 단순한 페인팅 스타일, 가상과 현실 결합 등도 학습했으며, 시바견의 표현 효과 개선도 시도했습니다.
하지만 구체적인 개념에 할당할 수 있는 이미지가 많지 않아 일부 개념은 몇 장의 이미지로만 학습되었으며, 여러 번 시도해야 할 수도 있습니다. 다양성 학습은 과학습 현상을 개선하는 데 도움이 되며, 학습 대상이 아닌 분야에서도 더 나은 일반화 성능을 이끌어낼 수 있습니다.
추가적으로 캐릭터 '고양이 열세'(cat13), ori, 삼보(sanbao), 정범(jingfan)도 일부 학습했으나, 사용된 이미지가 많지 않았습니다. 이는 개념 간섭이 모델의 일반화 능력에 예기치 않게 영향을 미치는 것을 최소화하기 위한 조치이며, 캐릭터 학습 방식을 사용하지 않았습니다. 따라서 이 LoRA는 캐릭터 학습에 특화된 모델이 아니며, 특징 학습이 부족하여 성능이 좋지 않습니다.
LoRA 강도는 0.6에서 시작해 보는 것을 권장합니다. 낮은 값도 효과가 있을 수 있습니다. 일부 개념은 0.85처럼 더 높게 설정해야 할 수도 있으며, 1로 설정하면 이미지 품질이 명백히 저하됩니다. 일부 개념의 특징이 뚜렷하면 낮게 설정하는 것이 더 나을 수 있습니다.
이미지 보기:
다중 시각 학습(Multi-view training was carried out)
후면도는 학습 이미지가 적고 베이스 모델의 영향을 크게 받습니다
(하지만 후면도가 학습되지 않았다면 그려지지 않습니다.)

머리만 학습(fursuit head)
fursuit head training was carried out

기타 개념 학습 Other concept training


캐릭터 "고양이 13" 및 일반화 능력 테스트
기본 프롬프트(주의: yuguo) prompt:
yuguo,digital drawing,anthro cat,red and gold hat,blue eyes,brown fur,
wearing red and blue outfit,kemono furry,

일반화 능력 테스트 (LoRA가 원래 모델의 일반화 능력을 방해할 수 있으므로 이 실험을 수행함)
Generalization ability test (lora may interfere with the generalization ability of the original model, so this experiment is conducted)

알려진 문제:
베이스 모델 Ratatoskr에 학습 문제가 있어 표현이 자연스럽지 못합니다. LoRA는 일부 과도한 매끄러움과 과도한 조명 문제를 개선할 수 있지만, 여전히 효과가 좋지 않습니다.
원치 않는 조명이 발생하며, 매우 어두운 장면을 그리기 어렵습니다. 높은 CFG로 더 어두운 색을 표현할 수 있으나, 자연스럽지 않게 보이며, 낮은 CFG나 CFG 스케일링을 사용해 자연스럽게 보이게 하면 품질이 떨어집니다.
순수한 검은색 이미지에 대한 재생성으로 개선할 수 있습니다.
손의 표현이 좋지 않습니다. LoRA는 손의 품질을 저하시킬 수 있으며, 이는 fursuit가 손과 발톱을 가지며 가리개 관계가 더 추상적이기 때문일 수 있습니다.
데이터셋이 불균형하여 일부 개념은 과학습되어 일부가 지나치게 밝아졌으며, 이는 LoRA의 영향입니다. 일부 구조의 품질도 저하되었으며, 예를 들어 칼을 그리는 것이 어려운 경우가 있습니다.
- CLIP 강도를 낮추면 개선될 수 있지만, 새로운 개념은 CLIP 강도에 의존하기 때문에 강도를 낮추면 효과가 사라지며, 너무 낮으면 일부 이미지가 붕괴됩니다.
fursuit 개념에서 파란색이 지나치게 많고, 때로는 통제 불가능하게 파란색이 나타납니다.
색상과 무늬가 복잡하여 색상 오염이 발생하며, 줄무늬를 제어하기 어려울 수 있습니다. 이상한 털 색상과 질감 분포를 어떻게 표현할지 모르겠습니다.
kemono 스타일은 종에 대한 감수성이 낮으며, 라벨링 조차 종을 구분하기 어려워 드래곤의 뿔을 수동으로 추가해야 할 수도 있습니다.
전체 신체 이미지는 일부 흐릿할 수 있으며, 충분한 털 세부사항을 표현하려면 큰 해상도가 필요합니다.
내부 털 색상을 명시하기 어려울 수 있습니다. 예를 들어, 배색을 흰색 외에 다른 색으로 그리기가 어렵습니다. 데이터가 부족하고 베이스 모델 자체도 이를 잘 구현하지 못하기 때문입니다. 이 문제는 0610 이후 개선되었습니다.
- 저는 이 문제 해결을 위해 몇 가지 전용 라벨링 시도를 했으나, 수동으로 색칠하고 이미지에서 이미지 생성을 사용하는 것을 권장합니다.
모델 차이점:
1006
조명 개선을 시도했습니다. 일부 학습 데이터의 채도와 밝기를 강제로 낮추고, 어두운 환경 이미지를 추가로 학습에 사용했습니다.
물과 상호작용하는 이미지를 추가; 미적 표현을 향상시키기 위한 이미지를 추가; 반동물복 표현을 향상시키기 위한 이미지를 추가; 일부 테스트에서 세부 표현이 이전 버전보다 나빴습니다.
082x
V8THL은 14.1보다 색상 표현이 더 낫지만, Pony보다는 못할 수 있습니다. 더 어두운 배경을 얻을 수 있지만, 전경은 여전히 지나치게 밝습니다.
Pony는 Pony Realism을 기반으로 시도했으며, 여러 스타일 표현은 좋지 않았습니다. 그러나 밤과 색상 표현은 14.1보다 더 나으며, 자연스러울 수 있습니다. 부정적인 프롬프트로 리얼리즘을 입력하면 애니메이션과 같은 비리얼리즘 스타일을 도입할 수 있습니다.
14.1은 최신 Ratatoskr14.1을 기반으로 하지만, 베이스 모델의 색상과 야간 표현이 좋지 않다는 점에 유의하세요. LoRA는 이 현상을 더욱 악화시킬 수 있습니다. 그러나 LoRA는 V8THL에서도 사용할 수 있으며, 시각적 경험은 14.1보다 더 나은 편입니다.
더 많은 이미지 학습 추가 및 더 정밀하고 세밀한 설명 시도
배색 표현 개선 및 물속 효과 개선
일부 doge 이미지 추가
열쇠고리, 두꺼운 코팅, 단순 페인팅 등의 스타일 효과 개선
더 높은 해상도 및 미적 품질의 이미지 도입
ori 및 삼상기담 캐릭터 추가 (소량 학습)
그러나 이전 버전과 비교하여 학습 라운드가 14에서 10으로 감소했으며, 학습이 부족할 수 있습니다.
0419:
고품질 픽셀 이미지 일괄 교체, 그러나 학습이 부족함; 표준 LoRA 사용; 색상 표현은 여전히 0312보다 나쁘며, 문제는 베이스 모델일 수 있습니다.
0412x:
두꺼운 코팅 등의 색상 표현이 좋지 않음; lycoris의 locon 사용; 사용한 픽셀 이미지 품질이 낮아 이미지가 혼란스러움; 일부 개념은 과적합되며, 일부는 미적합됨.
0312:
학습 내용이 상대적으로 적었으나, 삼두육비 개념을 학습했습니다. 그러나 이 개념의 효과가 좋지 않아 이후 포기했습니다. 두꺼운 코팅 등 비리얼리즘 스타일의 색상 표현에서는 좋았음; Ratatoskr - V8 [THL] 기반으로 학습됨
Model difference:
1006
An attempt was made to improve the lighting. The saturation and brightness of some training data were forcibly reduced, and a batch of dark environment images were added for training
Add more interactive images with water; Add more images to improve aesthetics; Add more images to improve the half-beast costume; In some tests, the detail performance was worse than that of the previous version
082x
The V8THL has better color performance than the 14.1, but perhaps not as good as the pony. You can get a darker background, but the foreground is still too bright.
Pony, based on Pony realisim as an attempt, performed poorly in multiple styles. However, the night and color performance are better than 14.1 and might be more natural. By filling in realistic prompts in a negative way, some non-realistic styles can be introduced, such as anime
14.1 is based on the latest Ratatoskr14.1, but please note that the bottom mold has issues with poor color and night performance. lora seems likely to make this phenomenon even more severe. But you can find that lora can also be used on V8THL, and the visual experience is better than 14.1.
Add more image training and try some more precise and detailed descriptions
Try to improve the color of your belly and enhance the effect in water
Some doge pictures have been added
Improve the effects of some styles such as key chains, thick coating, and simple painting
Introduce images with more resolutions and higher aesthetic quality
Add ori and the threefoldrecital Tale character, with only a small amount of training
However, compared to before, the training has now been reduced from 14 rounds to 10 rounds, which might be insufficient
0419:
I replaced a batch of high-quality pixel images, but some of the training was insufficient ; Use standard lora; The color performance is still not as good as that of 0312. The problem might lie in the base mold
0412x:
The color representation is not good; Use lycoris' locon ;The quality of the pixel images used is not high, and the images appear messy ;Some concepts are overfitting, while others are underfitting
0312:
The training content was relatively limited, but the concept of three heads and six arms was trained. However, the effect of this concept was not good, so it was abandoned later. ; It performs well in terms of color in non-realistic aspects such as thick coating ; Based on Ratatoskr - V8 [THL]



















