Species

세부 정보

파일 다운로드

모델 설명

종족

이 모델은 기본 모델에 제가 원하는 다양한 개념들을 추가해볼 수 있는지 실험해보기 위한 것입니다. 충분히 잘 작동했다고 생각되어, 혹시 다른 분들도 이러한 요소들을 원하신다면 공유합니다.

768x768 해상도로 EveryDream2를 사용해 훈련하였습니다.

어떤 분들이 LORA를 요청하셨는데, 저는 별로 신경 쓰지 않기로 결정했습니다. 이렇게 많은 요소들을 하나의 LORA가 합리적으로 다룰 수 있다고 확신하기 어렵습니다. 원하시면 구체적인 종족에 맞는 LORA를 따로 찾아보시기 바랍니다.

포함된 개념들:

  • "세나우르(she-centaurs)"와 "x티어(x-taur, x는 어떤 동물, 예: 사슴, 고양이 등)", 두 가지 모두 다양한 스타일과 캐릭터에서 매우 잘 작동하지만, 가끔 말이나 변종이 나올 수도 있습니다.

  • "스라이姆(slime)"도 매우 일관성 있게 잘 작동합니다.

  • "클링온(Klingon)"은 매우 잘 작동합니다. "뱃레스(ceil)도 포함되어 있지만, 품질이 좋지 않습니다.

  • "트위렉(Twi'lek)"은 잘 작동하지만, 머리 꼬리가 팔보다 더 자주 잘못 나타납니다.

  • "트릴(Trill)"은 괜찮은 편이지만, 잘못된 위치에 반점이 생기기 쉬워 보입니다. 아마도 더 많은 훈련이 필요했을 것입니다.

  • "페라엔지(Ferengi)"는 머리 형태는 잘 표현하지만, 얼굴은 약간 이상하게 나옵니다.

  • "아사리(Asari)"는 매우 잘 작동하고, 훈련 데이터에 남성은 없었음에도 남성도 잘 표현합니다.

  • "사타르(Satyr)"는 괜찮은 편이지만, 이유 없이 간혹 '세나우르'로 잘못 인식하는 경우가 있습니다.

  • "카다시안(Cardassian)"는 매우 잘 작동합니다.

  • "토틀(Tortle)"은 좋은 결과를 내며, "닌자 토틀"도 역시 잘 됩니다 ;)

  • 어이없이도, "푸드폴크(foodfolk)"를 추가했습니다.

  • "마이콘ิด(Myconid)"는 일반적으로 작동하지만, 백발 머리의 인물처럼 버섯 모자를 쓴 인물이 많아집니다.

  • "고르곤(Gorgon)"은 괜찮은 편입니다. 가끔는 뱀 머리도 어느 정도 잘 표현됩니다. 외부에 비어 있는 입이나 공포의 표정이 많아서, 얼굴 표정을 더 잘 레이블링해야 했을 것입니다. "나가(Naga)"도 약간 추가했으며, 두 요소가 잘 어울립니다.

  • "거인 x"는 맥락에 따라 괜찮은 결과를 내는데, 예: "작은 도시를 걷는 중" 또는 "산에 있음"

  • "작은 x"는 때때로 작동하지만 불일관성이 큽니다. 맥락이 반드시 필요합니다. 예: "병 속에 갇혀 있음" 혹은 "거대한 테이블 위에 있음" 같은 상황에서는 상당히 잘 작동합니다.

  • "살라리안(Salarian)"은 아주 잘 작동합니다.

  • "퀴아리안(Quarian)"도 잘 작동합니다.

  • "크로그안(Krogan)"은 괜찮은 편이지만, 성별을 정확히 이해하지 못합니다. (가면을 쓰지 않은 여성 크로그안의 예시가 양적 측면에서 부족했을 가능성 있음)

  • "드렐(Drell)"은 잘 작동합니다.

  • "럭산(Luxan)"도 괜찮은 편이지만, 훈련 데이터에서 한 캐릭터에 빗나가 있는 것처럼 집중하는 경향이 있습니다.

  • 몸통이 필요 없으면 "레비어탄 조종사(Leviathan pilot)"도 가능합니다.

  • "안도리안(Andorian)"은 괜찮은 편이지만, 뿔을 자주 잊어버립니다. "네이믹ian( Namekian )"도 마찬가지입니다.

  • "토그루타(Togruta)"는 좋은 편이지만, 꼬리가 자주 엉망이 됩니다.

  • "우키(Wookie)"는 괜찮은 편이지만, 성별 표현은 정확하지 않습니다.

  • "볼리안(Bolian)"은 괜찮은 편이지만, 가끔 맞고 가끔 틀립니다. 데이터가 충분히 포함되지 않은 듯합니다.

  • "티렉스(T-Rex)"는 이전보다 훨씬 더 잘 훈련되었으며, 가끔 정확한 표현도 나오지만 여전히 불안정합니다.

  • "군간(Gungan)"은 괜찮은 편인데, 큰 실수 없이 결과가 나오는 비율이 약 30% 정도일 가능성이 있습니다.

  • "터져 나온 민간인(drowned folk)"은 제 생각에는 꽤 좋은 결과가 나왔습니다.

  • 저는 "돌라한(Dullahan)"을 추가했지만, 매우 혼란스럽고 거의 자주 잘못 표현됩니다. "사이클롭스(Cyclops)"도 마찬가지입니다.

  • "x 엘리멘탈(x elemental)"은 아주 잘 작동합니다. x에 대해 복잡하고 이상한 걸 넣어보세요 ;)

  • "고블린(Goblin)"은 여기서 대규모 훈련이 이루어졌으며, 다양한 수정자(modifier)도 포함되어 있습니다. 시도해보세요: "패스파인더", "귀여움", "오크", "하프 오크". 아래에 더 많은 일반적인 예시가 있습니다.

  • "타랙시안(Talaxian)"은 괜찮은 편입니다.

  • "젬하더(Jem'Hadar)"는 몇몇 스타일에서는 잘 작동하지만, 모든 스타일에서 그렇지 않습니다.

  • "나비(Na'vi)"는 괜찮아 보이지만, 강한 스타일 편향이 있습니다.

  • "카민안(Kaminoan)"은 괜찮은 편이지만, 목 길이가 다양하게 나옵니다.

  • 오버플로우 방지를 위해 일부 "인간(human)" 훈련을 추가했습니다. 음의 프롬프트에도 자유롭게 사용 가능합니다.

  • "가루다(Garuda)"는 괜찮은 편입니다.

  • "외형 조절 인형(Poseable doll)"은 재미있는 것도 포함되어 있지만, 사실 사진처럼 보이기 시도하는 경향이 강합니다.

  • "나무형 인형(Lizardfolk)"과 "드라코닉 리저포크(Draconic lizardfolk)"는 모두 잘 작동합니다.

  • "비에라(Viera)"는 괜찮은 편이지만, 제가 원하는 것보다 훨씬 더 레이스 머리가 강조되는 경향이 있습니다.

  • "볼카노인(Vulcan)"은 잘 작동하며, 일부는 "로무렉(Romulan)"으로도 태그되어 있습니다.

  • 다양한 판타지 요소들이 이미 일부 표현되었기에 이번엔 더 많은 훈련을 거쳐 더 신뢰할 수 있게 작동하도록 개선되었습니다: "나가", "머프ول크(Merfolk)", "페어리(Fairy)", "엔젤(Angel)", "수크쿠버스(Succubus)", "미노타우르(Minotaur)", "뮤미(Mummy)", "그리핀(Griffin)", "놈(Noll)", "엘프(Elf)", "드라이아드(Dryad)", "트리포크(Treefolk)", "현령(Ghost)", "하르피(Harpy)", "스피닉스(Sphinx)", "지니(Genie)"

  • 다양한 일반 태그도 훈련에 포함되었으며, 검증은 완전하지 않지만, 다음은 대부분 긍정적/부정적 프롬프트에서 사용할 수 있다고 생각됩니다: "파란/빨간/초록/갈색/보라색 피부", "빨간/ glowing 눈", "꼬리", "악마 꼬리", "뾰족한 귀", "뾰족한 코", "수염", "추가 팔", "작고/hip/드래곤/새깃 날개", "옷이 찢어짐", "x를 드는 중", "어깨에 x가 있음", "작은/양/큰 뿔" 등, 그리고 아마도 저는 잊어버린 다른 것들도 있어요.

  • "변형 일련사(Transformation sequence)"는 글쎄요, 그냥 농담 삼아 추가한 것이었고 잘 작동할 줄은 생각하지 못했습니다. 정확하지는 않지만, 예상보다는 괜찮습니다. "변형 일련사, 남자에서 여자로"가 가장 잘 작동하지만, "변형 일련사, x에서 y로"가 형식이며, 어떤 경우에도 작동하는 경우가 있습니다. "3파트형(3-part)"도 가장 일관성 있게 작동하지만, 긴 이미지를 만들고 큰 "x-파트"도 시도해볼 수 있습니다. 확실히 일부 세부 사항(특히 얼굴)은 수동으로 수정이 필요할 것입니다.

피드백 언제든지 환영합니다! 저는 더 많은 종족을 포함한 버전도 만들 계획이므로, 어떤 종족을 가장 원하시는지 알려주세요.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.