狲思邈,中国最著名的兔狲 | Sun Simiao, a Pallas's cat.

세부 정보

파일 다운로드

모델 설명

모델 필수 트리거 단어: s4s the Pallas's cat, 추천 추가 프롬프트: manul, 4K HD hi-res photo, realistic Hasselblad photography

모델 권장 가중치: 0.6~0.8

모델 권장 파라미터: Sampler: DPM++ 2M Karras 또는 Restart, CFG scale: 7~10, Size≥1024x1024, Steps≥30

심정:

狲思邈(2015-2022.10.10)은 야생에서 구조되어 서닝 야생동물원에서 생활했던 수컷 펠라스 고양이로, 중국에서 가장 유명한 펠라스 고양이였다.

서닝 야생동물원의 원장이 수년간 꾸준히 펼쳐온 과학적 홍보와狲思邈 및 그 가족들의 매력 덕분에, 펠라스 고양이는 이전까지 거의 알려지지 않은 종에서 스타 종으로 떠올랐고, 눈표범, 중국산 산고양이 등과 함께 중국 티베트고원의 야생동물 보호 및 생태계 보전에 대한 대중의 관심을 크게 높였다.

狲思邈이라는 이름은 그가 처음 관찰된 짝짓기 행동이 단 4초밖에 지속되지 않아, ‘孙思邈’(중국 유명한 의학자)의 발음과 유사하다는 이유로 유래되었다. 그의 삶은 농담처럼 시작되었고, 농담처럼 끝났다. 작년 10월 10일, 그는 닭고기를 급하게 먹다가 뼈에 목이 막혀 질식사했다. 일반적으로 사육된 펠라스 고양이의 수명은 약 12~15년이며, 7세는 여전히 젊고 건강한 나이였다. 내 주변의 펠라스 고양이 애호가들은 이 소식에 큰 충격과 슬픔을 느꼈다.

올해 2월, 나는 처음으로 LoRA 모델을 접했고, 처음으로 만든 모델은 펠라스 고양이 LoRA였다. 펠라스 고양이처럼 소수종은 Midjourney나 공식 SD 모델조차 그 모습을 정확히 출력하지 못한다. LoRA는 이러한 소수 개념을 미세 조정하는 데 이상적인 방식이다. 나는 초기 펠라스 고양이 LoRA를 filmgirl과 유사한 일반 모델로, 서로 다른 펠라스 고양이 개체 300장을 사용해 학습했다. 이 모델을 마친 후, 두 번째 LoRA 모델로狲思邈 전용 이미지 LoRA를 만들기로 결정했다.为此, 나는 펠라스 고양이 애호가들에게서狲思邈의 사진 263장을 수집했다. 이 중 70%는 @yspenny가 제공했고, 30%는 @서닝야생동물원@원장@천음문화창작관이 제공했다. 그러나 결과는 좋지 않았고, 주된 이유는 세 가지였다:

  1. 대부분의 사진은 휴대폰으로 촬영되었고, 원거리에서 자르고 나온 사진이라 화질이 흐릿하며 자동 필터 색상이 강하게 적용되어 있다.

  2. 서닝 야생동물원의 고양이 전시실 유리는 녹색을 띠고 반사가 심해 화질을 더욱 악화시켰다.

3.狲思邈은 평생 고양이 전시실의 작은 전시 공간에서만 살아서 배경이 단조롭고 고정되어 있었다.

이러한 이유로 모델의 출력률이 낮아, 수많은 리롤을 통해 이미지를 생성해야 했다. 따라서 나는 이 버전의狲思邈 LoRA를 공개하지 않고, 종종 노트북을 밤새 돌리고 다음 날 아침 가장 만족스러운 이미지를 선택해 내 동물 과학 홍보 계정에 게시했다. 나는 한 번 위보에 글을 올려, 이처럼 방대한 이미지 선별이 AI가 나를 역으로 미세 조정해, 내 머릿속의狲思邈의 실제 모습에 대한 기억을 왜곡하고 있다고 농담했다. 그래서 잠시 후에는 반드시 실제 사진을 보며 눈을 씻어야 했다.

그러나 지금은 이 문제에 새로운 해결책이 생겼다. 여전히 많은 단점이 존재하지만, SDXL 모델은 성능 면에서 명백히 강력하며, 상한선도 훨씬 높다.狲思邈의 사망 1주기를 맞아, 나는 그의 전용 이미지 SDXL LoRA 모델을 다시 제작하기로 결정했다. SD1.5 모델의 한계를 극복하기 위해 다음과 같은 개선점을 시도했다:

  1. SDXL 모델은 학습 데이터의 품질에 매우 민감하므로, 기존 학습셋의 품질이 불균형하고 대부분 흐릿했기 때문에, 학습셋을 224장으로 다시 선별했다. 일부 이미지를 제거하면서, 구할 수 있는 이미지들은 AI로 화질을 향상시켰다.

  2. 정규화셋에 전 세계에서 촬영된 펠라스 고양이 개체 1,006장을 추가했다. 학습은 자연어와 태그를 혼합한 방식으로 진행했고, 다양한 트리거 단어의 효과를 테스트하여狲思邈 학습셋과 펠라스 고양이 정규화셋 간에 적절한 구분과 연결을 도모했다. 개체의 외형을 오염시키지 않으면서 정규화셋을 통해 털의 세부 표현을 강화하고, 배경 환경 및 표현, 자세를 일반화하려 노력했다.

  3. adam8bit, DAdaptAdam, Prodigy, adaFactor 네 가지 최적화기를 각각 사용해 학습을 진행했다. 생성된 모델들을 비교하고 융합한 결과, 색상 세부 표현, 일반화 능력, 유사도 세 가지 측면에서 가장 균형 잡힌 버전을 공식 LoRA로 선택했다.

최종 결과는 나에게 매우 만족스러웠다. 여전히 SDXL의 원거리 흐릿함이라는 일반적인 문제는 존재하지만, 색상, 표정, 배경의 일반화 능력은 이전 모델보다 현저히 향상되었다.

이것이狲思邈 LoRA 모델의 완전한 제작 과정이다. 이 모델은 단지 몇 명만이 자주 사용할 소수의 모델이 될 것이고, 나에게는 이 모델의 가치는 내가 만든 다른 어떤 모델보다도 낮지 않다. 이 모델은 나와 학습 이미지를 제공해준 촬영자들이狲思邈을 기리는 마음의 결집이기 때문이다. 그의 삶은 짧았지만, 빛났다. 가난한 중국 서북부의 동물원에서 좋은 사진을 많이 남기지 못했지만, 그의 디지털 영생은 가능하다. 1년이 지났다. 우리는 그를 매우 그리워한다.狲星에서 천천히 밥을 먹고, 모든 게 잘되기를 바란다.

狲이 죽었으나, 그 모습은 살아 숨 쉰다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.