kongou/金剛 (Kantai Collection)

세부 정보

모델 설명

  • 이 모델에는 두 개의 파일이 있습니다. 두 파일을 함께 사용해야 합니다!!!
  • 관련 트리거 단어는 참고용이며, 때에 따라 조정이 필요할 수 있습니다.
  • 임베딩 모델의 권장 가중치는 1이며, 이는 더 높은 정확도를 제공합니다. 더 높은 일반화가 필요할 경우 0.5로 낮출 수 있습니다.
  • LoRA 모델의 권장 가중치는 0.85입니다. 오염의 징후가 있다면 0.5로 낮추는 것을 고려하세요.
  • 미리보기 이미지는 몇 개의 고정된 테스트 프롬프트와 클러스터링된 데이터셋 특성에서 파생된 여러 프롬프트를 사용하여 생성되었습니다. 랜덤 시드가 사용되었으며, 선택적 편향은 배제되었습니다. 보이는 그대로 나옵니다.
  • 복장에 대한 특수한 학습은 수행되지 않았습니다. 복장에 대응하는 프롬프트는 제공된 미리보기 게시물을 확인하세요.

이 모델 사용 방법

이 모델에는 두 개의 파일이 있습니다. 두 파일을 함께 사용해야 합니다!!!. 이 경우, kongou_kantaicollection.ptkongou_kantaicollection.safetensors 두 파일을 모두 다운로드한 후, kongou_kantaicollection.pt를 텍스처 반전 임베딩으로, 동시에 kongou_kantaicollection.safetensors를 LoRA로 사용해야 합니다.

이 모델에는 두 개의 파일이 있습니다. 두 파일을 함께 사용해야 합니다!!!. 이 경우, kongou_kantaicollection.ptkongou_kantaicollection.safetensors 두 파일을 모두 다운로드한 후, kongou_kantaicollection.pt를 텍스처 반전 임베딩으로, 동시에 kongou_kantaicollection.safetensors를 LoRA로 사용해야 합니다.

트리거 단어는 kongou_kantaicollection이며, 권장 태그는 best quality, masterpiece, highres, solo, {kongou_kantaicollection:1.15}, brown_hair, long_hair, ahoge, hairband, hair_bun, double_bun, headgear, smile, nontraditional_miko, purple_eyes, open_mouth입니다.

이 모델의 학습 방식

이 모델은 HCP-Diffusion으로 학습되었습니다. 자동 학습 프레임워크는 DeepGHS 팀에서 유지관리합니다.

일부 미리보기 이미지가 Kongou Kantaicollection처럼 보이지 않는 이유

미리보기 이미지에 사용된 모든 프롬프트 텍스트(이미지를 클릭하면 확인 가능)는 학습 데이터셋에서 추출한 특징 정보를 기반으로 클러스터링 알고리즘을 사용하여 자동으로 생성되었습니다. 이미지 생성 시 사용된 시드도 랜덤하게 생성되었으며, 이미지에는 어떤 선택이나 수정도 가해지지 않았습니다. 따라서 이러한 문제가 발생할 가능성이 있습니다.

실제로 우리 팀 내부 테스트 결과, 이러한 문제가 발생하는 대부분의 모델은 미리보기 이미지보다 실제 사용 시 더 나은 성능을 보입니다. 필요한 유일한 조치는 사용하는 태그를 조정하는 것입니다.

이 모델이 과적합되거나 과소적합된 것처럼 느껴지는데, 어떻게 해야 하나요?

우리 모델은 huggingface 저장소 - CyberHarem/kongou_kantaicollection_에 공개되어 있으며, 모든 단계의 모델이 저장되어 있습니다. 또한 학습 데이터셋은 huggingface 데이터셋 - CyberHarem/kongoukantaicollection에 공개되어 있으므로 도움이 될 수 있습니다.

왜 더 나은 이미지만 선택하지 않나요?

이 모델의 데이터 수집, 학습, 미리보기 이미지 생성 및 게시까지의 전체 과정은 인간의 개입 없이 100% 자동화되었습니다. 이는 우리 팀이 진행하는 흥미로운 실험으로, 데이터 필터링, 자동 학습, 자동 게시를 포함한 완전한 소프트웨어 인프라를 구축했습니다. 따라서 가능하다면, 피드백이나 제안을 더 많이 주시면 저희에게 매우 귀중한 정보가 됩니다.

원하는 캐릭터의 복장을 정확히 생성할 수 없는 이유

현재 학습 데이터는 다양한 이미지 웹사이트에서 수집되었으며, 자동화된 파이프라인에서는 캐릭터가 보유한 공식 이미지를 정확히 예측하기 어렵습니다. 따라서 복장 생성은 학습 데이터셋의 라벨을 기반으로 클러스터링을 수행하여 가능한 최적의 재현을 시도합니다. 우리는 이 문제를 계속 해결하고 최적화하려 노력하지만, 완전히 해결하기 어려운 도전 과제입니다. 복장 재현의 정확도는 수동으로 학습된 모델의 수준과 같을 수 없습니다.

사실, 이 모델의 가장 큰 장점은 캐릭터 본인의 고유한 특징을 재현하는 능력과 더 큰 데이터셋으로 인한 상대적으로 강력한 일반화 능력입니다. 따라서 이 모델은 복장 변경, 캐릭터 포즈 조정, 물론 캐릭터의 NSFW 이미지 생성 작업에 매우 적합합니다!😉

다음과 같은 사용자 분들에는 이 모델 사용을 권장하지 않으며, 이에 대해 사과드립니다:

  1. 가장 미세한 디테일까지도 원래 캐릭터 디자인과의 차이를 용인할 수 없는 분들.
  2. 캐릭터 복장 재현에 높은 정확도가 요구되는 적용 환경에 직면한 분들.
  3. Stable Diffusion 알고리즘 기반 AI 생성 이미지의 잠재적 무작위성에 받아들일 수 없는 분들.
  4. LoRA를 사용한 캐릭터 모델 학습의 완전 자동화 과정에 불편함을 느끼거나, 캐릭터를 존중하기 위해 수동 작업만으로 학습해야 한다고 믿는 분들.
  5. 생성된 이미지의 내용이 자신의 가치관에 반한다는 느낌을 받는 분들.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.