SciStyle

세부 정보

파일 다운로드

모델 설명

SciStyle

SciStyle v1은 제가 개발 중인 새로운 이미지 캡셔닝 파이프라인을 위한 테스트 모델입니다. 이 모델은 다양한 스타일/매체의 1,000장의 이미지 서브셋으로 학습되었습니다. 단 1,000장의 이미지로 학습된 모델이 이토록 놀라운 결과를 내어, 이를 여기에 공개하기로 결정했습니다. 전체 모델은 현재 개발 중입니다.

이미지 캡셔닝 파이프라인에 대한 자세한 정보는 아래 링크된 제 Discord 스레드를 참조하세요


문의/피드백/업데이트?

Unstable Diffusion Discord의 내 스레드 방문


정보

S&D

베이스 모델: Stable Diffusion v1.5

유형: 실험적 미세 조정

Clip: 1

매체: 멀티미디어

캡션 스타일: 자연어 + Booru 스타일

데이터셋 크기: 서브셋, 25,000장 중 4,000장 + DnD 데이터셋

학습 해상도: 768x768

v1과의 차이점: 판타지 중심 강화, DnD 데이터셋으로 추가 학습


V1

베이스 모델: Stable Diffusion v1.5

유형: 실험적 미세 조정

Clip: 1

매체: 멀티미디어

캡션 스타일: 자연어 + Booru 스타일

데이터셋 크기: 서브셋, 25,000장 중 1,000장

학습 해상도: 768x768


V2

베이스 모델: Stable Diffusion v1.5

유형: 실험적 미세 조정

Clip: 1

매체: 멀티미디어

캡션 스타일: 자연어 + Booru 스타일

데이터셋 크기: 서브셋, 25,000장 중 6,500장

학습 해상도: 768x768

v1과의 차이점: 다양한 SF 및 판타지 세계관의 더 많은 생물종 포함


기능

  1. 멀티미디어: 프롬프트에 매체를 포함만 시켜도 다양한 예술 매체의 이미지를 생성 가능합니다.

  2. 자연어 및 Booru: 자연어 프롬프트와 Booru 스타일 프롬프트 모두 수용합니다.

  3. 추가 세부 정보: SD 모델들이 종종 놓치는 미세한 세부 사항(장면 내 객체/주체 수, 배경 정보, 이미지 각 부분의 색상 정보, 분위기 등)을 이해합니다. (이 기능이 어떻게 구현되는지에 대한 자세한 정보는 위의 Discord 스레드를 참조하세요.)

  4. 유연성: 다른 SD1.5 체크포인트/LoRA와 쉽게 병합 가능합니다.


사용법

특수 토큰:

  • SciStyle: 프롬프트 시작 부분에 클래스 토큰으로 사용할 수 있으나 필수는 아닙니다.

  • 다양한 예술 매체에 대한 태그: 예시로 a comic book illustration of, 90s anime screencap of 또는 프롬프트 끝에 단순히 매체를 추가: comic book illustration, photorealistic. 이는 태그 위치의 단순 예시이며, 다른 매체도 자유롭게 실험해보세요.


권장 설정

샘플러/솔버:

  • Euler a

    • 스텝: 20 - 32

    • CFG: 6 - 7.5

  • DPM++ SDE Karras

    • 스텝: 30 - 40

    • CFG: 6 - 8.5

  • DPM++ 2M SDE Karras

    • 스텝: 50+

    • CFG: 7 - 8

이 설정은 단지 권장 사항입니다.

고해상도 수정(Hires Fix)

모든 ESRGAN 모델에 대한 설정:

  • 확대 배수:

    • 해상도가 > 512x768인 경우 1.5

    • 2.0을 초과하지 마세요 (고성능 시스템이 아닌 경우)

  • 노이즈 감소 강도:

    • 0.25 - 0.35
  • 고해상도 스텝:

    • 샘플링 스텝이 60을 초과하면,

      • 고해상도 스텝 = 샘플링 스텝의 절반
    • 그렇지 않으면 0으로 유지


확장 프로그램

ADetailer
여기서 다운로드

Neutral Prompt

여기서 다운로드

사용법 가이드는 각 저장소 설명을 참고하세요


부정적 임베딩

샘플 이미지 재생산을 원할 경우에만 사용하세요. 개인적으로 저는 부정적 임베딩을 사용하지 않고 간단한 부정 프롬프트를 사용한 후, 새로운 아이디어에 따라 + 또는 - 토큰을 추가/제거하는 방식을 선호합니다. 부정적 임베딩은 샘플 생성 시 추론 속도를 높이기 위해만 사용합니다. 그럼에도 불구하고 EasyNegative 등 다른 부정적 임베딩도 이 모델과 함께 사용해도 괜찮습니다.


다른 모델도 확인해보세요

SDXL

SD1.5

LoRA

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.