Miyamoto Hikari PonyXL
세부 정보
파일 다운로드
모델 설명
20241130v2.6
“검토 대상으로 표시됨”으로 인해 많은 이미지가 조회되기까지 여러 시간 지연됩니다.
SUMMER LESSON의 Miiyamoto Hikari
트리거 단어: miiyamotohikari
Pony Diffusion V6 XL 체크포인트로 학습됨.
갤러리에 모더레이션을 설정했으므로 NSFW 콘텐츠가 표시되지 않을 수 있습니다.
업데이트
기존 스타일에 더 가까운 캐릭터 특징을 개선했습니다. 이전 버전에서 체크포인트 변경으로 인해 발생했던 평평함 문제를 해결했습니다. 얼굴 조명이 혼란스러운 경우, 네거티브 프롬프트에 '백라이트'를 포함하세요.
그러나 현재 톤이 약간 황변되어 있으므로, 다른 체크포인트를 사용하여 해결할 수 있습니다.
사용 팁
제 게시물에서 예제 프롬프트를 찾을 수 있습니다.
긍정적 프롬프트에 "realistic", “photorealistic”, "photorealism"과 같은 단어를 추가하고, 가중치를 높여 원래 스타일과 특징을 최대한 유지하세요.
제 프롬프트는 기본적으로 [캐릭터 특성] + [스타일] + [표정] + [복장] + [카메라 및 액션] + [배경] 순서로 구성되어 있으며, 필요에 따라 삭제하거나 수정할 수 있습니다.
권장 가중치: 1~0.6, 캐릭터 외형이 원하는 대로 나타날 때까지 조정하세요.
업스케일 값 권장치는 약 1.3~2.0, 노이즈 제거 강도는 0.2입니다.
전신샷과 같은 상황에서 얼굴 왜곡이 쉽게 발생할 수 있습니다. 얼굴 왜곡이 발생할 경우, 수선을 위해 ADetailer를 사용해 보세요.
20241101v2.5
이 버전은 일관성이 향상되었지만 약간 평평해졌습니다.
20240819v2
트리거 단어: miiyamotohikari
다시 시도하며 새로운 옷을 추가했습니다.
이 모델의 학습 및 생성된 이미지는 오직 학습 목적을 위해 사용됩니다.
위 이미지에서 예제 프롬프트를 찾을 수 있습니다.
권장 가중치: 1.0~0.6, 캐릭터 외형이 원하는 대로 나타날 때까지 조정하세요.
업스케일 값 권장치는 약 1.5, 노이즈 제거 강도는 0.2입니다.
모델의 3D 스타일을 줄이려면 네거티브 프롬프트에 "3D"를 추가하세요.
추가하지 않으면 결과가 게임 스타일에 더 가까워질 수 있습니다.
캐릭터 특징이 매우 평평해지거나 디테일이 사라질 경우, 긍정적 프롬프트에 "realistic", “photorealistic”, "photorealism" 등을 추가하고 가중치를 높여 원래 형태와 특징을 최대한 유지하세요.
3D 모델 스타일이 너무 딱딱하다면, 모델 가중치를 줄이세요.
이 캐릭터에 관심이 있고 다른 복장의 더 선명한 스크린샷이 있다면, 데이터셋에 추가하기 위해 저에게 보내주세요.
이 버전은 3D 및 비-3D 스타일 모두에서 제가 만족하는 균형을 달성했습니다.
로그
데이터셋에 두 장의 AI 생성 이미지를 추가했습니다. 이 방법을 이전에도 시도했지만, 너무 많은 이미지를 추가하여 모델이 빠르게 과적합되었고, 매우 딱딱하고 생기 없는 스타일로 이어졌습니다.
이후 두 버전에서는 AI 생성 이미지를 추가하지 않았고, 데이터셋의 스타일은 기본적으로 3D 스타일과 일관되었습니다. 그러나 학습된 모델은 3D 스타일에서 매우 딱딱했고, 네거티브 프롬프트에 "3D"를 추가하면 스타일이 매우 평평해져 많은 디테일을 잃었습니다.
저의 목표는 캐릭터 특징을 대부분 유지하면서 너무 딱딱하지 않은 모델을 학습하는 것입니다.
따라서 데이터셋에 다른 스타일의 이미지 여전히 추가해야 하지만, 얼마나 추가할지는 문제입니다.
현재 이 모델의 주요 문제는: "3D"를 네거티브 프롬프트에 추가할 경우, 생성된 이미지가 많은 디테일을 잃고 선 스타일이 두드러지며, 긍정적 프롬프트에 "realistic" 및 "photorealism" 등의 태그를 포함시키고 모델 가중치를 낮추는 것이 좋습니다(약 0.8이 적절함).
이 캐릭터가 웃을 때 치아가 자주 문제가 됩니다.
여전히 많은 문제가 있으며, 향후 Flux 기반 학습이 더 나은 결과를 가져올 것으로 기대합니다.
20240807 v1
데이터셋의 태그를 반복적으로 수정하고, 일부 이미지를 추가하거나 삭제하여 변수를 통제해 보았습니다.
결국 가장 큰 영향을 미친 요인 중 하나는 Scale weight norms 값의 설정이었습니다. 이번에는 이 값을 1로 설정했으며, 이전에는 2.5, 3.6, 5를 시도해 보았습니다. 결과는 값이 커질수록 과적합 현상이 심해졌고, 반대로 값이 작아질수록 모델 출력 결과가 점점 평평해졌습니다.
LR Scheduler는 재시작이 있는 cosine을 사용했으며, 재시작 횟수는 3회입니다. 현재 이 모델은 비교적 좋은 균형을 달성했으나, 제가 현재 모델의 스타일을 좋아하지 않습니다. 약간 기름지고, 무게감이 부족하며 입체감이 떨어집니다.
그러나 더 나은 개선을 원한다면, 다른 체크포인트로 전환하는 것이 가장 뚜렷한 효과를 줄 것이라 생각합니다.
20240804 v0.5
이 버전은 사용자 친화적이지 않습니다.
모델 학습 경험을 쌓은 후, 과거 모델을 더 잘 학습할 수 있을 것이라 생각했지만, 현실은 제가 여전히 어리석었다는 것을 보여주었습니다. 이 모델은 아직 제 기대에 미치지 못했습니다.
현재 이 모델의 주요 문제는 다음과 같습니다:
네거티브 프롬프트에 "3d"를 추가하면, 모델 출력 결과가 매우 평평해지고 캐릭터 특징이 쉽게 사라집니다;
네거티브 프롬프트에 "3d"를 추가하지 않으면, 모델 출력 결과가 매우 딱딱합니다.
향후 제 지식이 향상된다면, 이 모델을 계속 학습할 계획입니다.
데이터셋에서 흐릿한 이미지, 스타일이 일관되지 않은 이미지, AI 생성 이미지(이러한 이미지는 빠르게 과적합됩니다)를 모두 정리하고, 데이터셋을 두 부분으로 나누었습니다: 한 부분은 3D 모델, 다른 부분은 게임 스타일 중심입니다. 게임 스타일 중심 부분의 학습 반복 횟수를 2로 설정하여 캐릭터 특징을 유지하려고 했습니다;
캡션을 최적화하고 과거의 많은 오류를 수정했습니다.



















