Taikaponi

세부 정보

파일 다운로드

모델 설명

이것은 "Train Difference"를 사용하여 다양한 체크포인트 및 LoRA 병합을 대상으로 하여 일반적인 평면 병합이 아닌 기반으로 한 페ONY 기반 체크포인트 병합입니다.

LoRA는 체크포인트에 직접 적용되지 않았으며, 대신 모델은 다른 체크포인트를 향해 "학습"되었습니다.

목표는 Pony의 "기본 품질"을 향상시키고 기본 "네이티브 스타일"을 변경하여 부정적 프롬프트를 덜 사용해도 더 나은 이미지를 생성할 수 있도록 하는 것이었습니다.

그러나 제가 발견한 점은, "베이스 페ONY"로 학습된 일부 LoRA가 그 스타일을 그대로 계승하여 이 모델에 적용할 때 그림 스타일이 왜곡된다는 것입니다.

이것은 Pony 베이스 모델이므로 관련된 모든 태그와 프롬프트가 이 모델과 호환됩니다. 또한 병합 과정에서 일부 기능이 손상되었을 수 있습니다.

저는 이 모델로 즐거운 시간을 보냈고, 다른 사람들도 흥미로워할 수 있을 것 같아 공유하려고 합니다. 이는 제가 여기에 처음으로 만든 모델이므로 의견을 환영합니다.

모든 Stable Diffusion 모델 및 LoRA 관련 작업을 수행해 주신 분들께 감사드립니다. 이분들이 진정으로 힘든 작업을 해주셨기 때문입니다.


프롬프트를 시작하려면 Pony 기본 품질 트리거 단어를 사용하세요:

  • score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up,

그 후 원하는 이미지 요소나 아이템을 입력하세요.

이 모든 태그를 사용하면 모델은 Pony가 이 모든 태그로 학습되었기 때문에 이미지에 더 많은 요소를 추가합니다. score 태그에 대한 자세한 정보는 다음 기사에서 확인하세요:

"score_9란 무엇이며 Pony Diffusion에서 어떻게 사용하는가"

https://civitai.com/articles/4248

하지만 예시처럼 더 낮은 점수를 생략하고 적절히 조합할 수도 있습니다. 예를 들어 제가 주로 사용한 조합은 다음과 같습니다:

  • score_9, score_8_up, score_8, score_9

또는

  • score_9, score_8_up, score_7_up

등. 원하는 품질 또는 스타일에 따라 조정하세요. 또는 이미지에 뭔가 부족해 보인다면, 더 낮은 점수를 포함해보세요.

긴 프롬프트의 경우, 일부 단어에 강조를 높이는 것이 도움이 될 수 있습니다:

  • (detailed:1.2)

이 예시에서는 괄호 안의 단어/요소에 대해 1.2배의 강조를 적용합니다. 따라서 긴 프롬프트에서는 이 방식으로 자주 강조되어 집중도를 높일 수 있습니다.

이 모델은 Pony 베이스이므로 다음 데이터 선택 태그도 사용할 수 있습니다:

  • source_pony

  • source_furry

  • source_cartoon

  • source_anime

평가 태그:

  • rating_safe

  • rating_questionable

  • rating_explicit

그리고:

  • censored

  • uncensored

문자, 스타일, 아티스트도 작동하지만, 기본 스타일이 변경되었기 때문에 제 경험상 이 모델은 아티스트 및 스타일을 다른 방식으로 표현합니다:

  • 일부는 훈련 데이터의 일부를 잃어 더 나빠질 수 있습니다.

  • 일부는 품질은 향상되지만 아티스트의 원래 스타일을 잃고, 모델의 스타일로 왜곡됩니다.

  • 일부는 이전과 동일하게 작동합니다(다른 모델에도 포함되어 있었을 가능성이 높음).

LoRA를 사용할 때, 높은 LoRA 강도에서 이상한 이상 현상이 발생하면 강도를 0.5로 낮추고 여전히 문제가 발생하는지, LoRA 개념이 여전히 적용 가능한지 확인한 후, 상황에 따라 강도를 조정하세요.

또한 CFG 스케일=7을 사용 중이라면, CFG 스케일=5로 낮춰보세요. 이는 문제를 해결하거나(적어도 개선할 수 있습니다).

일부 LoRA는 0.8 또는 심지어 1.0 강도에서도 잘 작동합니다.

그러나 이 모델은 베이스 페ONY에서 "벗어나" 학습되었기 때문에, 다른 Pony 기반 모델에서는 잘 작동하던 LoRA와 호환되지 않을 수 있습니다.


부정적 프롬프트는 베이스 Pony에 비해(아마도) 더 적게 필요할 것입니다. 다른 모델들은 이미 이 측면을 개선했으며, "Train Difference"는 그 개선점을 이 병합에 포함했습니다.

부정적 프롬프트는 여전히 일반적으로 작동하지만, 이미지 구성에 영향을 줄 수 있으므로 시도해보세요.

저는 보통 모델의 학습된 스타일을 활용하기 위해 빈 부정적 프롬프트로 시작합니다. 그 후 프롬프트를 조정하면서 불필요한 요소를 제거하거나, 구성/품질/스타일을 수정합니다. 예를 들어, 이미지에 존재하지 않아야 할 단어를 추가하여 구성에 변화를 줍니다.

다음은 유용한 부정적 트리거입니다. 참고: 일부는 스타일 변화를 강제할 수 있습니다.

실제 얼굴 피하기:

  • (realistic, lip, nose, tooth, rouge, lipstick, eyeshadow:1.0)

과도한 근육형 몸체 피하기:

  • (abs, muscular, rib:1.0)

보케 제거:

  • (depth of field, bokeh, blurry:1.0)

모자이크 및 검열 제거:

  • (censored, mosaic censoring, bar censor, convenient censoring, pointless censoring:1.0)

붉은색 볼 제거:

  • (blush, embarrassed, nose blush, light blush, full-face blush, shame, ashamed, shy:1.0)

일부 NSFW 효과 제거:

  • (trembling, motion lines, motion blur, emphasis lines:1.0)

이중 배꼽 제거 (euler a 및 hiresfix 사용 시 발생):

  • (double bellybutton)

워터마크 제거 등:

  • (watermark, signature, text font, username, error, logo, words, letters, digits, autograph, trademark, name:1.0)

일부 LoRA는 단순한 흰색 배경으로 학습되었으므로 이를 제거하려면:

  • (simple background, white background:1.0)

크기 비율

1024 x 1024 1:1 정사각형

1152 x 896 9:7

896 x 1152 7:9

1216 x 832 19:13

832 x 1216 13:19

1344 x 768 7:4 수평

768 x 1344 4:7 수직

1536 x 640 12:5 수평

640 x 1536 5:12 수직

그 외에도 중간값이나 최대 1440까지의 해상도도 사용 가능하지만, 캐릭터 형태가 왜곡되거나 팔다리가 길어질 수 있습니다.

또한 일부 LoRA는 특정 비율로 학습되었기 때문에 해당 비율에서 더 잘 작동합니다.

해상도를 조금 조정하면 내용물과 그 표현 방식이 달라질 수 있습니다. 특히 프롬프트의 모든 요소를 특정 해상도에 담기엔 공간이 부족할 때(긴/복잡한 프롬프트) 그렇습니다.

이미지에 존재하지 않아야 할 부정적 프롬프트를 추가해도 구성에 일정한 영향을 미칩니다. 일부는 더 크게, 일부는 덜 크게 영향을 줍니다.

예시 이미지는 SD Forge를 사용해 생성되었습니다. https://github.com/lllyasviel/stable-diffusion-webui-forge

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.