Kawashima Safaia (Sound! Euphonium)
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
- Civitai의 이용 약관으로 인해 일부 이미지를 업로드할 수 없습니다. 전체 미리보기 이미지는 HUGGINGFACE에서 확인할 수 있습니다.
- 이 모델은 두 개의 파일로 구성되어 있습니다. 반드시 함께 사용해야 합니다!!!
- 관련 트리거 단어는 참고용이며, 때에 따라 조정이 필요할 수 있습니다.
- pt 파일의 권장 가중치는 0.5-1.0, LoRA의 가중치는 0.5-0.85입니다.
- 이미지는 몇 가지 고정 프롬프트와 데이터셋 기반 클러스터링 프롬프트를 사용하여 생성되었습니다. 랜덤 시드를 사용하여 선택적 샘플링을 배제했습니다. 여기에 보이는 것이 바로 얻을 수 있는 결과입니다.
- 의상에 대한 특수한 학습은 수행되지 않았습니다. 제공된 미리보기 게시물을 확인하여 의상에 해당하는 프롬프트를 확인할 수 있습니다.
- 이 모델은 635장의 이미지로 학습되었습니다.
이 모델 사용 방법
이 모델은 두 개의 파일로 구성되어 있습니다. 반드시 함께 사용해야 합니다!!!. 이 경우, kawashima_safaia_soundeuphonium.pt와 kawashima_safaia_soundeuphonium.safetensors 두 파일을 모두 다운로드한 후, kawashima_safaia_soundeuphonium.pt를 텍스처 반전 임베딩으로, kawashima_safaia_soundeuphonium.safetensors를 LoRA로 동시에 사용해야 합니다.
このモデルには2つのファイルがあります。一緒に使う必要があります!!!。 この場合、kawashima_safaia_soundeuphonium.ptとkawashima_safaia_soundeuphonium.safetensorsの両方をダウンロード する必要があります。kawashima_safaia_soundeuphonium.ptをテクスチャ反転埋め込みとして使用し、同時にkawashima_safaia_soundeuphonium.safetensorsをLoRAとして使用してください。
这个模型有两个文件。你需要同时使用它们!!!。 在这种情况下,您需要下载kawashima_safaia_soundeuphonium.pt和kawashima_safaia_soundeuphonium.safetensors这两个文件,然后将kawashima_safaia_soundeuphonium.pt用作纹理反转嵌入, 同时使用kawashima_safaia_soundeuphonium.safetensors作为LoRA。
이 모델은 두 개의 파일이 있습니다. 두 파일을 함께 사용해야 합니다!!!. 이 경우에는 kawashima_safaia_soundeuphonium.pt와 kawashima_safaia_soundeuphonium.safetensors 두 파일을 모두 다운로드하신 다음에 kawashima_safaia_soundeuphonium.pt을 텍스처 반전 임베딩으로 사용하고, 동시에 kawashima_safaia_soundeuphonium.safetensors을 LoRA로 사용하셔야 합니다.
트리거 단어는 kawashima_safaia_soundeuphonium이며, 권장 태그는 best quality, masterpiece, highres, solo, {kawashima_safaia_soundeuphonium:1.15}, short_hair, brown_hair, blush, bow, hair_bow, serafuku, green_eyes, green_bow, ahoge, polka_dot, brown_eyes입니다.
이 모델의 학습 방식
이 모델은 HCP-Diffusion을 사용하여 학습되었습니다. 자동 학습 프레임워크는 DeepGHS Team에서 유지보수하고 있습니다.
일부 미리보기 이미지가 Kawashima Safaia Soundeuphonium처럼 보이지 않는 이유
미리보기 이미지에 사용된 모든 프롬프트 텍스트(이미지를 클릭하면 확인 가능)는 학습 데이터셋에서 추출한 특징 정보를 기반으로 클러스터링 알고리즘을 통해 자동 생성되었습니다. 이미지 생성 시 사용된 시드도 무작위로 생성되었으며, 이미지는 어떠한 선택이나 수정도 이루어지지 않았습니다. 따라서 이러한 현상이 발생할 수 있습니다.
실제 사용 경험을 바탕으로 한 내부 테스트 결과, 이러한 현상을 겪는 대부분의 모델은 미리보기 이미지보다 실제 사용 시 더 나은 성능을 보입니다. 필요한 유일한 조치는 사용하는 태그를 조정하는 것뿐입니다.
이 모델이 과적합 또는 과소적합처럼 느껴지는데, 어떻게 해야 하나요?
우리의 모델은 huggingface 저장소 - CyberHarem/kawashima_safaia_soundeuphonium에 공개되었으며, 모든 학습 단계의 모델이 저장되어 있습니다. 또한, 학습 데이터셋은 huggingface 데이터셋 - CyberHarem/kawashima_safaia_soundeuphonium에 공개되었으므로, 여러분에게 도움이 될 수 있습니다.
왜 더 나은 이미지만 선택하지 않나요?
이 모델의 데이터 수집, 학습, 미리보기 이미지 생성 및 게시에 이르기까지 모든 과정은 인간의 개입 없이 100% 자동화되었습니다. 이는 팀이 수행한 흥미로운 실험이며, 이를 위해 데이터 필터링, 자동 학습, 자동 게시를 포함한 완전한 소프트웨어 인프라를 구축했습니다. 따라서 가능하다면 여러분의 피드백이나 제안을 더 많이 받고 싶습니다. 이는 우리에게 매우 소중한 정보입니다.
원하는 캐릭터의 의상을 정확하게 생성하지 못하는 이유
현재 학습 데이터는 다양한 이미지 웹사이트에서 수집되었으며, 완전히 자동화된 파이프라인에서는 캐릭터가 어떤 공식 이미지를 보유하고 있는지 정확히 예측하는 것이 어렵습니다. 따라서 의상 생성은 학습 데이터셋의 라벨을 기반으로 클러스터링하여 가능한 한 최적의 재현을 시도합니다. 우리는 이 문제를 지속적으로 개선하고 최적화하려 노력할 것이지만, 완전히 해결할 수 없는 도전 과제입니다. 의상 재현의 정확성은 수동으로 학습된 모델의 수준과 같아질 수 없습니다.
사실, 이 모델의 가장 큰 장점은 캐릭터 본연의 특징 재현과 방대한 데이터셋으로 인한 비교적 강력한 일반화 능력에 있습니다. 따라서 이 모델은 의상 변경, 캐릭터 포즈 조정, 그리고 물론 캐릭터의 NSFW 이미지 생성 등의 작업에 적합합니다!😉
다음 그룹의 사용자는 이 모델을 추천하지 않으며, 이에 대해 사과드립니다:
- 가장 미세한 것까지도 캐릭터 원본 디자인과의 편차를 용인할 수 없는 분들.
- 캐릭터 의상 재현의 정확도에 높은 요구를 하는 사용 사례에 직면한 분들.
- Stable Diffusion 알고리즘 기반의 AI 생성 이미지에서 발생할 수 있는 잠재적 무작위성에 수용할 수 없는 분들.
- LoRA를 사용한 캐릭터 모델 학습의 완전 자동화 과정에 불편함을 느끼거나, 캐릭터를 존중하기 위해서는 반드시 수동으로 학습해야 한다고 믿는 분들.
- 생성된 이미지 내용이 자신의 가치관에 반한다고 느끼는 분들.



















