Pirates!
세부 정보
파일 다운로드
모델 설명
진행 중입니다. 현재의 해적 모델에 매우 불만족했습니다. 추론 결과 항상 코미컬한 두개골과 뼈 무늬가 모자에 그려진 모습이 나오고, 삼각모자도 항상 어색하게 보였습니다. 그래서 더 미학적으로 만족스러운 해적 모델을 만들려고 시도하고 있습니다. 네 가지 버전과 각각의 데이터셋을 함께 게시합니다. 커트라스의 형태, 삼각모자 또는 이각모자의 형태와 같은 세부 사항을 더욱 풍부하게 구현하는 방법에 대해 어떤 조언을 주실 수 있기를 바랍니다.
버전 1
가장 먼저 공개합니다. 아시다시피, 약간 지나치게 조니 뎁 스타일이 나오네요. 그래도 여전히 신뢰할 수 있는 해적 선장, 부선장, 여성 해적들을 일관되게 생성합니다. 실수로 차원을 9, 알파를 1로 설정하고 학습시켰습니다. 하지만 결과는 마음에 듭니다. 향후 더 낮은 차원과 알파를 사용해 실험해볼 계획입니다. 트리거 키워드는 p1r4t3s이며, 이를 생략해도 다른 효과를 얻을 수 있습니다. 다른 키워드는 "captain", "mate", "female"입니다. 프롬프트에 "pirate"라는 단어를 사용하지 마세요. 그렇지 않으면 기본 모델에 포함된 우스꽝스럽고 저질 해적 복장이 많이 생성됩니다.
버전 2
네트워크 알파와 차원을 128로 높였지만, 캡션이나 데이터셋의 가중치에는 큰 변화를 주지 않았습니다. 트리거 및 키워드는 첫 번째 버전과 동일합니다. 또한 클립 스킵을 2로 변경해 어떤 결과가 나오는지 확인했습니다.
버전 3
네트워크 차원과 알파를 16으로 낮췄고, 클립 스킵도 2로 설정했습니다. 데이터셋을 많이 재가중치하여 조니 뎁의 영향을 크게 줄이고, 여성 이미지의 가중치를 높였습니다. 특히 《블랙 세일즈》에 등장하는 앤 보니 캐릭터의 이미지를 더욱 강조했습니다. 이로 인해 생성된 이미지의 독창성이 향상되었습니다.
버전 4
차원과 알파는 16, 클립 스킵은 2로 유지했습니다. 삼각모자, 커트라스, 이각모자, 슬러치 모자와 같은 특정 아이템의 이미지를 데이터셋에 훨씬 더 많이 추가했습니다. 이러한 세부 사항에 대한 더 풍부한 데이터가 더 나은 추론 결과를 낼 것이라 기대했습니다. 하지만 그 효과가 있었는지는 확신이 서지 않습니다. 이 버전에서는 학습률을 이전 버전보다 훨씬 낮췄습니다. 큰 차이를 느끼지는 못했습니다. 한 가지 눈에 띄는 점은, 추가한 아이템들이 추론 결과에서 데이터 이미지에서의 크기 그대로 나타난다는 것입니다. 즉, 전체 장면과 조화를 이루는 크기로 나타나지 않습니다. 아마도 학습 데이터에서 이러한 아이템들을 상대적으로 더 작게 표현해 보는 것이 좋을지도 모르겠습니다. 그렇게 하면 추론 결과에서 실제 장면과 비슷한 크기로 나타날 수 있을 것입니다.



