Yasuhara Ema (Shirobako)
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
- 이 모델은 두 개의 파일을 가지고 있습니다. 두 파일을 함께 사용해야 합니다!!!
- 관련 트리거 단어는 참고용이며, 때로는 조정이 필요할 수 있습니다.
- 임베딩 모델의 권장 가중치는 1이며, 이는 더 높은 정확도를 제공합니다. 더 높은 일반화가 필요하다면 0.5로 낮출 수 있습니다.
- LoRA 모델의 권장 가중치는 0.85입니다. 오염의 징후가 있다면 0.5로 낮추는 것을 고려하세요.
- 미리보기 이미지는 몇 개의 고정된 테스트 프롬프트와 클러스터링 데이터셋 특징에서 파생된 여러 프롬프트를 사용하여 생성되었습니다. 랜덤 시드가 사용되었으며, 선택적 샘플링은 배제되었습니다. 보이는 그대로 출력됩니다.
- 복장에 대한 특별한 학습은 수행되지 않았습니다. 복장에 해당하는 프롬프트를 확인하려면 제공된 미리보기 게시물을 참고하세요.
이 모델 사용법
이 모델은 두 개의 파일을 가지고 있습니다. 두 파일을 함께 사용해야 합니다!!!. 이 경우, yasuhara_ema_shirobako.pt와 yasuhara_ema_shirobako.safetensors 두 파일을 모두 다운로드한 후, yasuhara_ema_shirobako.pt를 텍스처 반전 임베딩으로, yasuhara_ema_shirobako.safetensors를 LoRA로 동시에 사용해야 합니다.
이 모델은 두 개의 파일이 있습니다. 함께 사용해야 합니다!!!. 이 경우 yasuhara_ema_shirobako.pt와 yasuhara_ema_shirobako.safetensors 두 파일을 모두 다운로드한 후, yasuhara_ema_shirobako.pt를 텍스처 반전 임베딩으로 사용하고, 동시에 yasuhara_ema_shirobako.safetensors를 LoRA로 사용해야 합니다.
이 모델은 두 개의 파일이 있습니다. 두 파일을 함께 사용해야 합니다!!!. 이 경우에는 yasuhara_ema_shirobako.pt와 yasuhara_ema_shirobako.safetensors 두 파일을 모두 다운로드한 후, yasuhara_ema_shirobako.pt를 텍스처 반전 임베딩으로 사용하고, 동시에 yasuhara_ema_shirobako.safetensors를 LoRA로 사용해야 합니다.
트리거 단어는 yasuhara_ema_shirobako이며, 권장 태그는 best quality, masterpiece, highres, solo, {yasuhara_ema_shirobako:1.15}, black_hair, low_twintails, twintails, long_hair, green_eyes, bangs입니다.
이 모델의 학습 방법
이 모델은 HCP-Diffusion을 사용하여 학습되었습니다. 자동 학습 프레임워크는 DeepGHS 팀에서 유지보수하고 있습니다.
일부 미리보기 이미지가 요시하라 에마 시로바코처럼 보이지 않는 이유
미리보기 이미지에 사용된 모든 프롬프트 텍스트(이미지를 클릭하여 확인 가능)는 학습 데이터셋에서 추출된 특성 정보를 기반으로 클러스터링 알고리즘을 사용하여 자동으로 생성되었습니다. 이미지 생성 시 사용된 시드도 무작위로 생성되었으며, 이미지에는 아무런 선택이나 수정이 가해지지 않았습니다. 따라서 이러한 문제가 발생할 가능성이 있습니다.
실제 사용에서, 우리 팀의 내부 테스트 결과에 따르면, 이러한 문제를 겪는 대부분의 모델이 미리보기 이미지에서 보이는 수준보다 실제 사용 시 더 나은 성능을 발휘합니다. 당신이 필요한 유일한 작업은 사용하는 태그를 조정하는 것입니다.
이 모델이 과적합되거나 과소적합되었다고 느껴지는데, 어떻게 해야 하나요?
우리의 모델은 huggingface 저장소 - CyberHarem/yasuhara_ema_shirobako에 게시되어 있으며, 모든 학습 단계의 모델이 저장되어 있습니다. 또한, 학습 데이터셋은 huggingface 데이터셋 - CyberHarem/yasuhara_ema_shirobako에 공개되어 있으므로, 이는 도움이 될 수 있습니다.
왜 더 나은 이미지만 선택하지 않나요?
이 모델의 전체 과정은 데이터 수집, 학습, 미리보기 이미지 생성, 게시까지 인간의 개입 없이 100% 자동화되었습니다. 이는 우리 팀이 수행한 흥미로운 실험으로, 데이터 필터링, 자동 학습, 자동 게시를 포함한 완전한 소프트웨어 인프라를 개발했습니다. 따라서 가능하다면, 더 많은 피드백이나 제안을 부탁드립니다. 이는 우리에게 매우 중요한 가치를 지닙니다.
원하는 캐릭터의 복장을 정확히 생성할 수 없는 이유
현재 학습 데이터는 다양한 이미지 웹사이트에서 수집되었으며, 완전한 자동화 파이프라인에서는 캐릭터가 어떤 공식 이미지를 보유하고 있는지 정확히 예측하기 어렵습니다. 따라서 복장 생성은 학습 데이터셋의 레이블을 기반으로 클러스터링을 통해 최대한 정확한 재현을 시도합니다. 우리는 이 문제를 지속적으로 해결하고 최적화하려고 노력할 것이지만, 완전히 해결하기 어려운 도전 과제입니다. 복장 재현의 정확도는 수동으로 학습된 모델과 비교할 수 없을 가능성이 높습니다.
사실, 이 모델의 가장 큰 강점은 캐릭터 자체의 고유한 특성을 재현하는 능력과 더 큰 데이터셋으로 인한 상대적으로 뛰어난 일반화 능력에 있습니다. 따라서 이 모델은 복장 변경, 캐릭터 포즈 조정, 그리고 물론 캐릭터의 NSFW 이미지 생성과 같은 작업에 적합합니다!😉
다음과 같은 그룹은 이 모델을 사용하지 않는 것을 권장하며, 이에 대해 사과드립니다:
- 최소한의 세부 사항이라도 원래 캐릭터 디자인에서 벗어나는 것을 용납할 수 없는 분들.
- 캐릭터 복장 재현의 정확도에 높은 요구를 하는 사용 시나리오에 직면한 분들.
- Stable Diffusion 알고리즘을 기반으로 한 AI 생성 이미지의 잠재적 무작위성을 수용할 수 없는 분들.
- LoRA를 사용한 캐릭터 모델 학습의 완전 자동화 과정에 불편함을 느끼거나, 캐릭터를 경멸하지 않기 위해 반드시 수동으로만 학습해야 한다고 믿는 분들.
- 생성된 이미지 내용이 자신의 가치관에 반한다고 느끼는 분들.



















