나는 원본 이미지를 수동으로 레이블링(즉, 이미지에 나타나는 내용을 .txt 파일에 수작업으로 입력)하여, 아즈키와 비슷한 인물을 만들 것을 시사하는 내용이 포함되지 않도록 했습니다. 즉, "화이트 스킨, 고양이 귀, 흰 머리" 같은 태그를 추가하지 않았습니다. 이렇게 하면 러닝 툴이 요청 시 자동으로 이러한 태그를 적용한다는 것을 이해하게 되고, 아즈리엘을 소환하기 위해 매번 태그를 입력할 필요가 없게 됩니다. 사람들은 오직 변경 가능한 파라미터만 레이블링하세요!
사람들이 1보다 작은 가중치(예: 0.7 근처)를 사용할 것을 권장하는 것이 어색하게 느껴집니다. 이 모델은 표준 값 1일 때 가장 잘 작동합니다. 여러분은 자신들의 로라가 과도하게 학습되거나 간단한 캐릭터를 설명하기에 지나치게 많은 공간을 차지하지 않도록 확신하십니까?
참고로 저도 로라가 너무 많은 공간을 차지할 가능성이 있다는 생각이 듭니다. 실험해보아야겠습니다.
저는 보다 많은 데이터로 학습된 모델인 Anything-v3.1을 기반으로 학습을 진행했습니다. 이로 인해 일부 부작용이 생기기도 하는데, 이 로라를 더 최신 모델에 적용하면 원본 이미지보다 더 좋은 결과를 낼 수 있습니다. 이 메커니즘을 완전히 이해하지 못한 상태이지만, 알고 계신 분은 댓글로 알려주세요.
유일하게 마음에 들지 않는 점은 이 모델이 기본적으로 그의 녹색 티셔츠를 착용하지 않으며, 성인 형태에서는 뿔이 명시되지 않으면 고양이 귀를 그려냅니다. 이 태그들을 일부 레이블링에서 제거하는 게 좋을 수 있을지도 모르겠습니다. 테스트해봐야겠네요.
또한 원본 이미지에 18세 이상 컨텐츠는 전혀 포함하지 않았습니다. 그 이유는 다들 이해하시겠죠.
학습에 사용된 원본 이미지를 다운로드할 수 있습니다! 같은 방식으로 로라를 훈련시키는 분들은 이 이미지를 함께 첨부해 주시기 바랍니다. 매우 편리합니다!