Vanillaware Style PonyXL
세부 정보
파일 다운로드
모델 설명
이 모델의 학습 및 이 모델이 생성하는 이미지는 오직 학습 목적으로만 사용됩니다.
나는 아무것도 하지 않았다. 나는 단지 배달부일 뿐이다.
이 모델은 캐릭터 팩에 더 가까우며, 그 부작용은 그가 가져오는 스타일입니다.
30시간 이상 반복 시도를 거쳤고, 그 과정에서 거의 포기할 뻔했지만, 결국 더 균형 잡힌 효과를 달성했습니다. 가장 중요한 것은 내 학습 가설이 검증되었다는 점입니다. 향후 이 경험을 하나의 글로 정리할 수도 있습니다.
하지만 손의 품질 문제는 여전히 존재합니다.
트리거 단어: vanillastyle
위 이미지에서 예시 프롬프트를 찾을 수 있습니다.
이전 버전 모델의 프롬프트도 대부분 잘 작동했습니다.
내 프롬프트는 기본적으로 [캐릭터 특성] + [스타일] + [표정] + [복장] + [카메라 및 액션] + [배경] 순서로 구성되며, 필요에 따라 삭제하거나 수정할 수 있습니다.
특히 흐릿한 상황이 발생할 경우, 네거티브 프롬프트에 "thumbnail"을 추가하고 이미지가 선명해질 때까지 그 가중치를 높여보세요.
네거티브 프롬프트에 '3d'를 추가하면 더 나은 결과를 얻을 수 있으며, 'realistic', 'realism' 같은 태그를 추가하면 캐릭터의 특징이 강화됩니다.
권장 가중치: 1.0~0.6, 캐릭터 외관이 원하는 대로 나타날 때까지 조정하세요.
업스케일 값은 약 1.2~2.0, 노이즈 제거 강도는 0.2를 권장합니다.
데이터셋은 주로 조지 카미타니의 작품을 중심으로 구성되었습니다.
20240907v0.2
이 버전에서는 더 많은 이미지에 태그를 달았고, 나머지 이미지의 태그는 제거하여 신중하게 설정된 태그와의 충돌을 방지했습니다. (이 방법이 틀릴 수도 있습니다.)
학습 과정에서 데이터셋의 이미지가 프롬프트를 통해 정확히 표현되지 않는 경우가 너무 많았습니다. 다양한 태그를 변경하고 다시 학습해봤지만 결과는 같았습니다. 이 이미지들은 데이터셋 내에서 반복성이 낮고 연속성도 부족합니다.
마지막으로, 특정 캐릭터에 대해 학습 반복 횟수를 늘리면 모델이 이러한 이미지를 충분히 학습하지 못하는 문제를 방지할 수 있다는 글을 읽었습니다.
따라서 데이터셋 내의 단일 이미지들을 하위 폴더에 넣고 학습 반복 횟수를 2로 설정했으며, 이미 잘 학습된 이미지들은 그대로 두었습니다.
그러나 이러한 비연속적 이미지들에는 질적 문제가 꽤 많고, 현재로서는 수정하지 않았기 때문에 학습 반복 횟수를 늘린 것이 전체 스타일에 일정한 영향을 미쳤습니다.
다음 버전에서 개선하기 위한 가장 근본적인 방법은 데이터셋의 품질을 높이는 것이며, 동시에 캡셔닝 기법을 잘 활용해 약간 낮은 품질의 이미지에도 동일한 태그를 추가한 후, 모델 실행 시 모두 네거티브 프롬프트에 포함시키는 것입니다.
20240715v0.1
이 모델은 아직 v0.1 수준에 불과하며, 일반적으로 사용하기 어렵습니다. 더 나은 결과를 얻기 위해 데이터셋의 이미지에 더 세밀하게 태그를 달아주는 것이 최선입니다. 향후 점진적으로 이 모델의 학습을 완료할 수도 있습니다.
이 버전의 성능은 그리 좋지 않으며, 생성되는 이미지가 자주 혼란스러운 모습을 보입니다.
100개 이상의 이미지를 데이터셋으로 수집했으나, 수동 태그링에는 여전히 많은 양입니다. 처음에는 wd1.4를 사용해 모든 이미지에 태그를 달았지만, 태그 품질은 여전히 좋지 않았습니다. (제 사용법이 부족했을 수도 있으며, 여러분의 조언을 환영합니다.)
빠른 결과를 보기 위해, 이 데이터셋에서는 나의 개인적인 선호에 부합하는 일부 이미지만 수동으로 태그했습니다. 따라서 모델의 출력 효과는 이 이미지들에 대해 더 나아집니다.




















