XL realistic fursuit

세부 정보

파일 다운로드

모델 설명

이것은 매우 일반화된 동물 복장 LoRA로, 세 가지 흔한 동물 복장 스타일(kemono fursuit, realistic fursuit, toony fursuit)을 학습했으며, 후면도 또는 머리만 그릴 수 있습니다. 일반화 및 원본 모델 성능 향상을 위해 여러 다른 측면의 학습도 수행되었습니다. 다운로드 시 작은 파일은 프롬프트 예시입니다.

LoRA는 Ratatoskr를 기반으로 학습되었습니다. 이 모델은 다양한 스타일을 지원하지만, V8THL 이후로 명백하게 과학습되어 색상이 비정상적이며 받아들이기 어렵습니다. 따라서 더 나은 색상 및 배경 구조 표현이 필요하다면 이 버전을 사용하는 것이 좋습니다.

최신 14.1을 사용한다면, 이 버전을 기반으로 LoRA를 다시 학습했습니다. 동시에 pony realism을 사용하여 애니메이션 스타일을 이 모델에 도입해 보았지만, 좋은 성능을 기대하지 마십시오.

원본 모델의 효과를 향상시키기 위해, 애니메이션 스타일, 두꺼운 코팅 스타일, 128px 픽셀 스타일, 단순한 페인팅 스타일, 가상과 현실의 결합 등도 학습했으며, 시바견의 표현 효과 개선을 시도했습니다. 총 약 540장의 이미지를 사용했으며, 약 260장은 동물 복장 학습에, 나머지는 모델 성능 향상에 사용했습니다. 그러나 구체적인 개념에 할당된 이미지는 많지 않아 일부 개념은 몇 장의 이미지만으로 학습되었으며, 여러 번의 시도가 필요할 수 있습니다.

부가적으로 "猫十三"(cat13), ori, 삼보(sanbao), 경반(jingfan) 등의 캐릭터도 학습했으나 사용된 이미지가 많지 않습니다. 이는 개념 간섭으로 모델의 일반화 능력에 예기치 못한 영향을 주지 않기 위한 조치이며, 캐릭터 학습 방법을 사용하지 않았습니다. 따라서 이 모델은 캐릭터 전용 학습 모델이 아니며, 특징 학습이 부족하고 성능이 좋지 않습니다.

LoRA 강도는 0.6부터 시작해 보세요. 일부 개념은 0.85처럼 더 높게 설정해야 할 수도 있습니다. 1로 설정하면 이미지 품질이 명확히 저하됩니다. 일부 개념의 특징이 뚜렷해 더 낮게 설정해야 할 수도 있습니다.

더 많은 설명 보기 (기계 번역, "Show More"를 클릭하여 추가 지침 확인)

이것은 매우 일반화된 동물 복장 LoRA로, 세 가지 흔한 동물 복장 스타일(kemono fursuit, realistic fursuit, toony fursuit)을 학습했으며, 후면도 또는 머리만 그릴 수 있습니다. 일반화 및 원본 모델 성능 향상을 위해 여러 다른 측면의 학습도 수행되었습니다. 다운로드 시 작은 파일은 프롬프트 예시입니다.

LoRA는 Ratatoskr를 기반으로 학습되었습니다. 이 모델은 다양한 스타일을 지원하지만, V8THL 이후로 명백하게 과학습되어 색상이 비정상적이며 받아들이기 어렵습니다. 따라서 더 나은 색상 및 배경 구조 표현이 필요하다면 이 버전을 사용하는 것이 좋습니다.

최신 14.1을 사용한다면, 이 버전을 기반으로 LoRA를 다시 학습했습니다. 동시에 pony realism을 사용하여 애니메이션 스타일을 이 모델에 도입해 보았지만, 좋은 성능을 기대하지 마십시오.

원본 모델의 효과를 향상시키기 위해, 애니메이션 스타일, 두꺼운 코팅 스타일, 128px 픽셀 스타일, 단순한 페인팅 스타일, 가상과 현실의 결합 등도 학습했으며, 시바견의 표현 효과 개선을 시도했습니다. 총 약 540장의 이미지를 사용했으며, 약 260장은 동물 복장 학습에, 나머지는 모델 성능 향상에 사용했습니다. 그러나 구체적인 개념에 할당된 이미지는 많지 않아 일부 개념은 몇 장의 이미지만으로 학습되었으며, 여러 번의 시도가 필요할 수 있습니다.

부가적으로 "猫十三"(cat13), ori, 삼보(sanbao), 경반(jingfan) 등의 캐릭터도 학습했으나 사용된 이미지가 많지 않습니다. 이는 개념 간섭으로 모델의 일반화 능력에 예기치 못한 영향을 주지 않기 위한 조치이며, 캐릭터 학습 방법을 사용하지 않았습니다. 따라서 이 모델은 캐릭터 전용 학습 모델이 아니며, 특징 학습이 부족하고 성능이 좋지 않습니다.

LoRA 강도는 0.6부터 시작해 보세요. 일부 개념은 0.85처럼 더 높게 설정해야 할 수도 있습니다. 1로 설정하면 이미지 품질이 명확히 저하됩니다. 일부 개념의 특징이 뚜렷해 더 낮게 설정해야 할 수도 있습니다.

이미지 보기:

다중 시각 학습(Multi-view training was carried out)

후면도는 학습 이미지가 적고 기본 모델의 영향을 크게 받습니다

(하지만 후면도가 학습되지 않으면 그려지지 않습니다.)

머리만 학습(fursuit head)

fursuit head training was carried out

기타 개념 학습 Other concept training

캐릭터 "猫13" 및 일반화 능력 테스트

기본 프롬프트(주의: yuguo) prompt :

yuguo,digital drawing,anthro cat,red and gold hat,blue eyes,brown fur,

wearing red and blue outfit,kemono furry,

일반화 능력 테스트 (LoRA는 원본 모델의 일반화 능력을 방해할 수 있으므로 이 실험을 수행함)

Generalization ability test (lora may interfere with the generalization ability of the original model, so this experiment is conducted)

알려진 문제점:

  • 기본 모델 Ratatoskr에 학습 문제점이 있어 자연스럽고 사실적인 표현이 부족합니다. LoRA는 일부 과도한 매끄러움과 과도한 조명 문제를 개선할 수 있으나 여전히 효과가 좋지 않습니다.

    • 원치 않는 조명이 발생하며, 매우 어두운 장면을 그릴 수 없습니다. 높은 CFG로 더 어두운 톤을 얻을 수 있으나 자연스럽지 않으며, 낮은 CFG나 CFG 스케일링을 사용하면 자연스러워지지만 품질이 떨어집니다.

    • 순수한 검은 이미지에 대한 재생성으로 개선할 수 있습니다.

  • 손의 표현이 좋지 않습니다. LoRA가 손의 품질을 저하시켰을 가능성이 있으며, 이는 fursuit의 손과 발가락, 가림 관계가 더욱 추상적이기 때문일 수 있습니다.

  • fursuit 개념에서 파란색이 너무 많이 사용되며, 통제 불가능한 파란색이 나타납니다.

  • 색상과 무늬가 복잡하여 색상 오염이 발생하고, 줄무늬를 통제하기 어려운 경우가 많습니다. 이상한 털 색상과 질감 분포를 어떻게 설명해야 할지 모르겠습니다.

  • kemono 스타일은 종에 민감하지 않으며, 제 라벨링조차 종을 구분하기 힘들기 때문에, 드래곤의 뿔은 수동으로 추가해야 합니다.

  • 전체 이미지는 약간 흐릿해 보일 수 있으며, 충분한 털 세부 사항을 얻기 위해 큰 해상도가 필요합니다.

  • 안쪽 털 색상을 명확히 지정하기 어렵습니다. 예를 들어, 흰색 외의 배腹部 색상을 그리기 어렵습니다. 데이터가 적고 기본 모델 자체도 이를 구현하지 못하기 때문입니다.

    • 이 문제를 개선하기 위해 일부 특별한 라벨링을 시도했지만, 수동으로 색칠하고 이미지에서 이미지로(img2img)를 사용하는 것을 추천합니다.

모델 차이점:

082x

  • V8THL은 14.1보다 색상 표현이 더 나으나, Pony보다는 못할 수 있습니다. 더 어두운 배경을 얻을 수 있지만 전경은 여전히 너무 밝습니다.

  • Pony: Pony realism을 기반으로 시도한 것으로, 다중 스타일 표현은 좋지 않습니다. 그러나 밤과 색상 표현은 14.1보다 나으며 더 자연스러울 수 있습니다. 부정적 프롬프트에 리얼리즘 표현을 입력함으로써 애니메이션과 같은 비리얼리즘 스타일을 도입할 수 있습니다.

  • 14.1: 최신 Ratatoskr14.1을 기반으로 합니다. 그러나 기본 모델에 색상 및 야간 표현이 좋지 않은 문제가 있습니다. LoRA는 이 현상을 더욱 악화시킬 수 있습니다. 하지만 LoRA를 V8THL에 적용할 수 있으며, 시각적 경험은 14.1보다 더 나을 수 있습니다.

더 많은 이미지 학습을 추가하고, 더 정밀하고 상세한 설명을 시도했습니다.

배腹部 색상을 개선하고, 물 속 효과를 향상시키기 위해 시도했습니다.

몇 장의 doge 이미지를 추가했습니다.

열쇠고리, 두꺼운 코팅, 단순 페인팅 등의 스타일 효과를 개선했습니다.

더 높은 해상도와 미적 품질의 이미지를 도입했습니다.

ori와 삼상기담 캐릭터를 추가했으나 학습량은 매우 적었습니다.

그러나 이전과 비교해 학습 라운드가 14에서 10으로 줄어들어 학습이 부족할 수 있습니다.

0419:

고품질 픽셀 이미지 일괄 교체했으나 학습이 부족했습니다. 표준 LoRA 사용. 색상 표현은 0312보다 여전히 좋지 않으며, 문제는 기본 모델에 있을 수 있습니다.

0412x: 두꺼운 코팅 등의 색상 표현이 좋지 않음; lycoris의 locon 사용; 사용한 픽셀 이미지 품질이 낮고 이미지가 혼란스러움; 일부 개념은 과적합되고 다른 일부는 미적합함.

0312: 학습 내용이 상대적으로 적었으나, 삼두육비 개념을 학습했습니다. 그러나 이 개념의 효과가 좋지 않아 이후 포기했습니다. 두꺼운 코팅 등 비리얼리즘 스타일의 색상 표현에서는 잘 작동합니다. Ratatoskr - V8 [THL] 기반.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.