Tanaka Asuka/田中あすか (Sound! Euphonium)
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
- Civitai의 이용 약관으로 인해 일부 이미지를 업로드할 수 없습니다. 완전한 미리보기 이미지는 HUGGINGFACE에서 확인하실 수 있습니다.
- 모델 버전 v1.5.1 또는 v2.0+ 이상을 사용하시는 경우, 다른 LoRA와 동일하게 WebUI에서 간단히 사용할 수 있습니다. 이 모델은 kohya 스크립트로 학습되었습니다.
- 모델 버전 v1.5 또는 v1.4- 이하를 사용하시는 경우, 두 파일을 모두 사용해야 합니다. 자세한 내용은 설명의 "Pivotal Tuned 모델 사용 방법"을 참조하세요.
- 축소된 캐릭터 태그는 검은 머리, 긴 머리, 안경, 반프레임 안경, 파란 눈, 빨간 프레임 안경, 오버림 안경, 눈 사이의 머리카락입니다. 캐릭터의 핵심 특징(예: 머리카락 색상)이 안정적이지 않을 때 이 태그를 프롬프트에 추가하실 수 있습니다.
- pt 파일의 권장 가중치는 0.7-1.1, LoRA의 가중치는 0.5-0.85입니다.
- 이미지는 일부 고정 프롬프트와 데이터셋 기반 클러스터링 프롬프트를 사용하여 생성되었습니다. 임의의 시드를 사용하여 선택적 샘플링을 배제했습니다. 여기에 보이는 것이 바로 얻을 수 있는 결과입니다.
- 의상에 대한 특화된 학습은 수행되지 않았습니다. 제공된 미리보기 포스트를 확인하여 의상에 해당하는 프롬프트를 확인할 수 있습니다.
- 이 모델은 908장의 이미지로 학습되었습니다.
- 학습 설정 파일은 여기에서 확인할 수 있습니다.
- 모델의 사실성과 제어력을 균형 있게 유지하기 위해 자동으로 선택된 스텝은 5258입니다. 아래는 모든 스텝의 개요입니다. huggingface 저장소 - CyberHarem/tanaka_asuka_soundeuphonium에서 다른 추천 스텝을 시도해 보세요.

이 모델 사용 방법
이 섹션은 모델 버전 v1.5.1 또는 v2.0+에만 해당합니다.
다른 LoRA와 동일하게 간단히 사용할 수 있습니다. 이 모델은 kohya 스크립트로 학습되었습니다.
다른 LoRA처럼 간단히 사용할 수 있습니다. 우리는 이 모델을 kohya 스크립트로 훈련했습니다.
您可以像其他LoRAs一样简单地使用它。我们使用kohya脚本对该模型进行了训练。
(번역: ChatGPT)
캐릭터 웨이프를 찾고 있거나 우리의 기술에 관심이 있다면, 우리 디스코드 서버에 참여하세요.
이 모델의 학습 방법
- 이 모델은 **kohya-ss/sd-scripts**를 사용하여 학습되었으며, 이미지는 a1111의 WebUI와 API SDK를 통해 생성되었습니다.
- 자동 학습 프레임워크는 DeepGHS 팀에서 유지 관리합니다.
- 학습에 사용된 데이터셋은 CyberHarem/tanaka_asuka_soundeuphonium의
stage3-p480-1200이며, 총 908장의 이미지를 포함합니다. - 모델의 사실성과 제어력을 균형 있게 유지하기 위해 자동으로 선택된 스텝은 5258입니다.
- 학습 설정 파일은 여기에서 확인할 수 있습니다.
자세한 학습 정보 및 추천 스텝은 huggingface 저장소 - CyberHarem/tanaka_asuka_soundeuphonium을 참조하세요.
Pivotal Tuned 모델 사용 방법
이 섹션은 모델 버전 v1.5 또는 v1.4-에만 해당합니다.
이 모델은 두 개의 파일로 구성되어 있습니다. WebUI v1.6 이하 버전을 사용하는 경우 이 두 파일을 함께 사용해야 합니다!!! 이 경우 tanaka_asuka_soundeuphonium.pt와 tanaka_asuka_soundeuphonium.safetensors 두 파일을 모두 다운로드한 후, tanaka_asuka_soundeuphonium.pt를 embeddings 폴더에 넣고, 동시에 tanaka_asuka_soundeuphonium.safetensors를 LoRA로 사용해야 합니다. WebUI v1.7+를 사용하는 경우 일반 LoRA와 같이 safetensors 파일만 사용하면 됩니다. 이는 현재 a1111의 WebUI가 임베딩을 포함한 LoRA/Lycoris 모델을 공식적으로 지원하기 때문입니다. 자세한 내용은 여기를 참조하세요.
이 모델에는 2개의 파일이 있습니다. WebUI v1.6 이하 버전을 사용하는 경우, 이 두 파일을 함께 사용해야 합니다!!! 이 경우, tanaka_asuka_soundeuphonium.pt와 tanaka_asuka_soundeuphonium.safetensors 두 파일을 모두 다운로드한 후, tanaka_asuka_soundeuphonium.pt를 embeddings 폴더에 넣고, 동시에 tanaka_asuka_soundeuphonium.safetensors를 LoRA로 사용해야 합니다. webui v1.7+를 사용하는 경우, 일반 LoRA처럼 safetensors 파일만 사용하세요. 이는 현재 임베딩이 포함된 LoRA/Lycoris 모델이 a1111의 WebUI에 공식적으로 지원되기 때문입니다. 자세한 내용은 여기를 참조하세요.
此模型包含两个文件。如果您使用的是 WebUI v1.6 或更低版本,您需要同时使用这两个文件! 在这种情况下,您需要下载 tanaka_asuka_soundeuphonium.pt 和 tanaka_asuka_soundeuphonium.safetensors 两个文件, 然后将 tanaka_asuka_soundeuphonium.pt 放入 embeddings 文件夹中,并同时使用 tanaka_asuka_soundeuphonium.safetensors 作为 LoRA。 如果您正在使用 webui v1.7 或更高版本,只需像常规 LoRAs 一样使用 safetensors 文件。 这是因为嵌入式 LoRA/Lycoris 模型现在已经得到 a1111's webui 的官方支持, 更多详情请参见这里。
트리거 단어는 tanaka_asuka_soundeuphonium이며, 축소된 태그는 black_hair, long_hair, glasses, semi-rimless_eyewear, blue_eyes, red-framed_eyewear, over-rim_eyewear, hair_between_eyes입니다. 어떤 특징(예: 머리카락 색상)이 일시적으로 안정적이지 않을 때, 이 태그를 프롬프트에 추가할 수 있습니다.
일부 미리보기 이미지가 캐릭터처럼 보이지 않는 이유
미리보기 이미지에 사용된 모든 프롬프트 텍스트(이미지를 클릭하면 확인 가능)는 학습 데이터셋에서 추출된 특징 정보를 기반으로 클러스터링 알고리즘을 사용하여 자동으로 생성되었습니다. 이미지 생성 시 사용된 시드도 무작위로 생성되었으며, 이미지에는 어떤 선택이나 수정도 가해지지 않았습니다. 따라서 위와 같은 문제가 발생할 수 있습니다.
실제 사용 경험에 따르면, 내부 테스트 결과 이와 같은 문제가 발생하는 대부분의 모델이 미리보기 이미지보다 훨씬 더 나은 성능을 보입니다. 필요한 유일한 조정은 사용하는 태그를 조절하는 것입니다.
이 모델이 과적합 또는 미적합처럼 느껴지는데, 어떻게 해야 하나요?
여기 표시된 스텝은 자동으로 선택된 것입니다. 우리는 또한 다른 추천 스텝을 권장합니다. 원하는 스텝을 선택하려면 여기를 클릭하세요.
우리의 모델은 huggingface 저장소 - CyberHarem/tanaka_asuka_soundeuphonium에 게시되어 있으며, 모든 스텝의 모델이 저장되어 있습니다. 또한 학습 데이터셋은 huggingface 데이터셋 - CyberHarem/tanaka_asuka_soundeuphonium에 공개되어 있으며, 이는 도움이 될 수 있습니다.
왜 더 나은 이미지만 선택하지 않나요?
이 모델의 전체 과정 — 데이터 수집, 학습, 미리보기 이미지 생성 및 게시 —는 인간의 개입 없이 100% 자동화되어 있습니다. 이는 우리 팀이 수행한 흥미로운 실험이며, 이를 위해 데이터 필터링, 자동 학습 및 자동 게시를 포함한 완전한 소프트웨어 인프라를 개발했습니다. 따라서 가능하다면, 귀하의 피드백이나 제안을 더욱 환영합니다. 이는 우리에게 매우 소중한 정보입니다.
원하는 캐릭터 의상을 정확히 생성할 수 없는 이유
현재 학습 데이터는 다양한 이미지 웹사이트에서 수집되었으며, 완전히 자동화된 파이프라인에서는 캐릭터가 보유한 공식 이미지의 정확한 예측이 어렵습니다. 따라서 의상 생성은 학습 데이터셋의 라벨을 기반으로 클러스터링을 수행하여 최선의 재현을 시도합니다. 우리는 이 문제를 지속적으로 개선하고 최적화하려 노력하지만, 완전히 해결하기 어려운 도전 과제입니다. 의상 재현의 정확도는 수동으로 학습된 모델의 수준과 같지 않을 가능성이 높습니다.
실제로 이 모델의 가장 큰 강점은 캐릭터 본연의 특징을 재현하고, 더 큰 데이터셋으로 인해 상대적으로 뛰어난 일반화 능력입니다. 따라서 이 모델은 의상 변경, 캐릭터 자세 조정, 그리고 물론 캐릭터의 NSFW 이미지 생성 등의 작업에 적합합니다!😉
다음과 같은 그룹은 이 모델 사용을 권장하지 않으며, 사과의 뜻을 밝힙니다:
- 최소한의 디테일이라도 캐릭터 원본 디자인과의 편차를 용인할 수 없는 분들.
- 캐릭터 의상 재현에 높은 정확도를 요구하는 적용 환경을 사용하는 분들.
- Stable Diffusion 알고리즘 기반의 AI 생성 이미지에서 발생할 수 있는 잠재적 무작위성에 수용할 수 없는 분들.
- LoRA를 사용한 캐릭터 모델 학습의 완전 자동화 과정에 불편함을 느끼거나, 캐릭터를 존중하기 위해 반드시 수동 작업만으로 학습해야 한다고 여기는 분들.
- 생성된 이미지 내용이 자신의 가치관에 반하는 것으로 느끼는 분들.



















