Sakaki Shizuka (Shirobako)
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
- 이 모델은 두 개의 파일로 구성되어 있습니다. 두 파일을 함께 사용해야 합니다!!!
- 관련 트리거 단어는 참고용이며, 때에 따라 조정이 필요할 수 있습니다.
- 임베딩 모델에 권장되는 가중치는 1이며, 이는 더 높은 정밀도를 제공합니다. 더 높은 일반화가 필요하다면 0.5로 낮출 수 있습니다.
- LoRA 모델에 권장되는 가중치는 0.85입니다. 오염의 징후가 있다면 0.5로 낮추는 것을 고려하세요.
- 미리보기 이미지는 몇 개의 고정된 테스트 프롬프트와 클러스터링 데이터셋 특징에서 파생된 여러 프롬프트를 사용하여 생성되었습니다. 무작위 시드가 사용되었으며, 선택적 편향은 배제되었습니다. 보이는 그대로 결과가 나옵니다.
- 의상에 대한 특수한 트레이닝은 실시하지 않았습니다. 제공된 미리보기 포스트를 확인하여 의상에 해당하는 프롬프트를 확인하세요.
이 모델 사용법
이 모델은 두 개의 파일로 구성되어 있습니다. 두 파일을 함께 사용해야 합니다!!!. 이 경우, sakaki_shizuka_shirobako.pt와 sakaki_shizuka_shirobako.safetensors 두 파일을 모두 다운로드한 후, sakaki_shizuka_shirobako.pt를 텍스처 반전 임베딩으로 사용하고, 동시에 sakaki_shizuka_shirobako.safetensors를 LoRA로 사용하셔야 합니다.
이 모델은 두 개의 파일이 있습니다. 두 파일을 함께 사용해야 합니다!!!. 이 경우에는 sakaki_shizuka_shirobako.pt와 sakaki_shizuka_shirobako.safetensors 두 파일을 모두 다운로드하신 다음에 sakaki_shizuka_shirobako.pt을 텍스처 반전 임베딩으로 사용하고, 동시에 sakaki_shizuka_shirobako.safetensors을 LoRA로 사용하셔야 합니다.
트리거 단어는 sakaki_shizuka_shirobako이며, 권장 태그는 best quality, masterpiece, highres, solo, {sakaki_shizuka_shirobako:1.15}, red_hair, long_hair, single_hair_bun, blue_eyes, hair_bun입니다.
이 모델의 학습 방법
이 모델은 HCP-Diffusion을 통해 학습되었습니다. 자동 학습 프레임워크는 DeepGHS 팀에서 유지 관리하고 있습니다.
일부 미리보기 이미지가 사카키 시즈카 시로바코처럼 보이지 않는 이유
미리보기 이미지에 사용된 모든 프롬프트 텍스트(이미지를 클릭하면 확인 가능)는 학습 데이터셋에서 추출된 특징 정보를 기반으로 클러스터링 알고리즘을 통해 자동 생성되었습니다. 이미지 생성 시 사용된 시드도 무작위로 생성되었으며, 어떤 선택 또는 수정도 이루어지지 않았습니다. 따라서 위와 같은 문제가 발생할 수 있습니다.
실제로 내부 테스트 결과에 따르면, 이러한 문제를 겪는 대부분의 모델은 미리보기 이미지보다 실제 사용 시 더 나은 성능을 발휘합니다. 필요한 유일한 조치는 사용하는 태그를 조정하는 것뿐입니다.
이 모델이 과적합 또는 과소적합 같아 보이는데, 어떻게 해야 하나요?
저희 모델은 huggingface 저장소 - CyberHarem/sakaki_shizuka_shirobako에 공개되어 있으며, 모든 단계의 모델이 저장되어 있습니다. 또한 학습 데이터셋은 huggingface 데이터셋 - CyberHarem/sakaki_shizuka_shirobako에 공개되어 있어 도움이 될 수 있습니다.
왜 더 나은 이미지만 선택해서 사용하지 않나요?
이 모델의 데이터 수집, 학습, 미리보기 이미지 생성 및 공개까지의 전체 과정은 인간의 개입 없이 100% 자동화되어 있습니다. 이는 저희 팀이 수행한 흥미로운 실험으로, 데이터 필터링, 자동 학습, 자동 공개를 포함한 완전한 소프트웨어 인프라를 구축했습니다. 따라서 가능하다면, 피드백이나 제안을 주시면 매우 귀중합니다.
원하는 캐릭터의 의상을 정확히 생성할 수 없는 이유
현재 학습 데이터는 다양한 이미지 웹사이트에서 수집되었으며, 완전히 자동화된 파이프라인에서는 캐릭터가 보유한 공식 이미지를 정확히 예측하기 어렵습니다. 따라서 의상 생성은 학습 데이터셋의 레이블을 기반으로 클러스터링을 수행하여 최대한 정확하게 재현하려는 시도입니다. 우리는 이 문제를 계속 해결하고 최적화할 계획이지만, 완전히 해결할 수는 없는 도전 과제입니다. 의상 재현의 정확도는 수동으로 학습된 모델의 수준에 미치지 못할 것입니다.
사실, 이 모델의 가장 큰 강점은 캐릭터 자체의 고유한 특징을 재현하고, 더 큰 데이터셋 덕분에 상대적으로 뛰어난 일반화 능력을 갖춘 것입니다. 따라서 이 모델은 의상 변경, 캐릭터 포즈 설정, 그리고 물론 캐릭터의 NSFW 이미지 생성과 같은 작업에 적합합니다!😉
다음과 같은 그룹에는 이 모델의 사용을 권장하지 않으며, 이에 대해 사과드립니다:
- 가장 미세한 세부 사항까지도 원래 캐릭터 디자인에서 벗어나는 것을 용납할 수 없는 분들.
- 캐릭터 의상 재현에 높은 정확도가 요구되는 적용 환경에 사용하려는 분들.
- Stable Diffusion 알고리즘을 기반으로 한 AI 생성 이미지의 잠재적 무작위성을 수용할 수 없는 분들.
- LoRA를 이용한 캐릭터 모델 학습의 완전 자동화 과정에 불편함을 느끼거나, 캐릭터를 존중하기 위해서는 반드시 수동으로만 학습해야 한다고 생각하는 분들.
- 생성된 이미지 콘텐츠가 자신의 가치관에 반대된다고 느끼는 분들.



















