Voicemod protogen + protogen furry

세부 정보

파일 다운로드

모델 설명

Voicemod Protogen은 Automatic1111 webui의 DreamBooth 확장 기능을 사용해 훈련되었습니다. 이 모델은 Voicemod Protogen에 대한 단지 5장의 이미지와 일반적인 Protogen에 대한 10장의 이미지를 결합하여 훈련되었으며, 단순히 태그를 붙여 Protogen에 관한 더 많은 개념을 이해하도록 만들었습니다.

이전에는 해당 캐릭터에 대한 5장의 이미지만 사용해 시도했으나, 이는 Protogen 특징에 대한 지식 부족을 초래했고, 훈련 데이터의 사본처럼 보이는 이미지를 생성하는 경향을 보였습니다. 그래서 추가로 10장의 이미지를 포함시켰고, 그 결과 매우 좋았습니다!

이것은 제가 LoRA를 적응해본 후 발행하는 첫 번째 LoRA입니다. 약간의 실험 끝에, 이 LoRA가 충분히 출시할 만한 수준이라고 생각합니다.

훈련

이 LoRA는 Automatic1111 webui의 DreamBooth 확장 기능을 사용하여 훈련되었습니다. 총 15장의 Protogen 이미지를 사용하였으며, 이중 5장은 Voicemod Protogen의 이미지였습니다. 이미지에 대해 DeepBooru를 사용하여 캡션을 생성한 후, 밑줄 대신 공백을 사용하고, 더 구체적인 정보를 추가하며 잘못된 태그는 제거하였습니다.

75장의 분류기 이미지를 생성한 후 2시간 동안 LoRA를 훈련시켰습니다.

기본 모델은 AbyssOrangeMix3와 Anything v4.5의 50/50 병합 모델을 사용했습니다. 그러나 이 LoRA는 대부분의 모델에서 제대로 동작할 것입니다.

사용 방법:

메인 트리거 단어: "voicemod protogen"

추가 트리거 단어: "stripped thighhighs", "striped arm warmers", "[color] visor", "multicolored fur"/"multicolored hair", "[facial expression] expression"

부정적 프롬프트에 추천 포함 항목: "text", "speech bubble", "watermark"

알려진 제약 사항:

  • 3D 형태의 Protogen을 생성할 수 없습니다. 훈련 데이터는 거의 전부 2D였으며, 캐릭터가 2D에만 해당된다고 인식하게 되어 있기에, 보통 3D 콘텐츠를 생성하는 모델에 사용할 경우 대부분 2D 형태로 만들어낼 것입니다.

  • 비저 색상 변경 시, Protogen의 주요 테마 색상도 함께 변경되며, 일관성 없는 결과가 나올 수 있습니다.

참고 사항

이 모델은 다양한 종류의 Protogen을 생성할 수 있지만, 여전히 "[voicemod protogen]"을 명시해야 합니다. "protogen"만 적는 경우 종종 작동은 하지만 비저 관련 문제가 생깁니다. 따라서 반드시 "voicemod protogen"을 명시하고, 원하는 다른 세부 사항도 함께 지정하세요.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.