Women Wrestlers

세부 정보

모델 설명

실제 이미지를 사용하지 않고 이를 제작하는 것은 정말 고통스러운 일이었다. 그러나 작업을 완수하기 위해 실제 이미지를 참조하여 대체 이미지를 생성했다. 과정을 알고 싶다면 약간 흥미로울 수 있다.

나는 마치 무언가를 그릴 것처럼 전문 여성 레슬러 30장의 이미지를 시각적 참조용으로 수집했다. 그 이미지들로부터 Joy-Caption을 사용하여 캡션을 생성했고, 이를 Z-Image에 통과시켜 작업의 기초를 마련했다.

원본을 맞추기 위해 수 시간 동안 시도한 후, 마찬가지로 30장의 이미지를 엄선하여 첫 번째 단계에서 괜찮은 결과를 얻을 수 있었다. Z-Image가 너무 많은 것을 알고 있을까 봐, 얼굴 부분을 마스킹(흰색으로 칠함)했고, 이는 두 번째 단계(최종 단계)에서 다시 나를 괴롭힐 기회가 될 것이다.

이 이미지들을 OneTrainer에 통과시켰고, 일반적인 시스템 프롬프트(흰 마스크를 무시하라)를 사용하여 Qwen이 작업할 수 있는 이미지를 생성했다.

Z-Image는 이들 중 일부 인물을 알고 있으므로, 오류를 방지하기 위해 원본 사진과 유사한 인물의 이미지는 모두 제거했다. 이를 통해 실제 사람의 실제 이미지를 전혀 사용하지 않았음을 정직하게 말할 수 있으며, 남은 이미지들의 얼굴도 마스킹 처리하여 순수한 의도로 다음 단계로 진행했다. 이후, Qwen-image-edit를 통과시킬 때 변경하고 싶은 부분을 흰색 또는 검은색 오버레이로 수정하고, 복장 장식을 재현하기 위해 필요한 부분에 디자인을 추가했다.

그리고 실제로 그렇게 했다. Qwen에게 낙서의 의미와 내가 목표를 달성하기 위해 필요한 것으로 판단한 것들을 어떻게 변환해야 하는지 설명했다.

이 방식으로 근육을 강조하고, 얼굴 특징을 더 단단하게 만들며, 복장(의상)에 엠블럼을 추가하고, 인간의 도움을 받아 캐릭터의 외모를 수작업으로 제작하여, 그 특징들에 대한 단순한 암시만 유지했다.

이러한 이미지들에서 각각의 30명의 선택된 레슬러마다 2쌍씩 엄선하여 최종 데이터셋에 60장의 이미지를 확보했다.

그 후, 이 이미지들을 OneTrainer에 통과시켜 최종 단계를 수행했다.

나는 허용되고 안전한 콘텐츠 기준에 완벽히 부합하도록 외모를 완전히 혼합하는 데 신경을 썼다고 생각한다. 이 이미지들에 원본 외모가 전달될 가능성은 절대 없다. 왜냐하면 나는 그런 외모를 제공하지 않았고, Z-Image가 원본 인물과 '아마도, 거의, 약간, 어쩌면' 비슷해 보이는 것을 재생산하려 할 때도 필터링했기 때문이다.

그러나 최종 사용자가 생성한 이미지들 중 원본 실제 인물의 외모가 일부라도 나타난다면, 이는 인간적 해석의 결과이거나, 우리가 데이터셋을 인간으로 제한했기 때문에 발생하는 우연한 부분적 유사성일 뿐이며, 또는 Z-Image 자체가 그 인물을 알고 있을 뿐이다. 이 두 경우 모두 내 LoRA와는 아무런 관련이 없다. LoRA는 단지 색상, 장면, 물체 및/또는 피부색의 조합으로 인해 해당 깊은 데이터에 접근하기 쉬워지는 경로를 변경할 뿐이며, 이는 인물과 직접적으로 무관한 일반적인 우연적 시각 이미지일 뿐이다.

허억

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.