Spider Gwen / Gwen Stacy
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
이 모델은 스파이더 Gwen / Gwen Stacy의 생동감 있는 일러스트레이션/3D 스타일 이미지를 생성하는 데 도움을 목적으로 합니다.
마스크를 벗은 캐릭터를 얻으려면 "Gwen Stacy"라는 용어를, 마스크를 쓴 캐릭터를 얻으려면 "Spider Gwen"을 사용하는 것이 더 효과적입니다. 옷을 전혀 입지 않은 캐릭터를 원한다면 이 두 용어를 모두 사용하지 않고, "누구"라는 표현 없이 단순히 옷을 기술하세요.
버전 1.1은 선명하고 대비가 강하며 눈에 띄는 일러스트레이션 쪽으로 더 기울어져 있으며, 3D 효과에서 벗어나고 있습니다. 다만, 낮은 가중치를 사용하면 여전히 3D 효과를 얻을 수 있습니다.
저는 종종 LoRA의 대상 단계로 Chroma를 사용하여 최종 대상인 이 경우 Z-Image를 위한 데이터셋을 생성합니다. 그러나 때로는 이 대상으로 Illustrious를 사용하기도 하며, 특히 전체 데이터셋을 하나의 단계에서 유도할 때 그렇습니다. 이 경우 저는 Illustrious의 개선된 버전을 선택했습니다.
이 LoRA를 게시했을 때 저는 아직 내 데이터셋에 사용해온 Illustrious 모델의 출처를 몰랐지만, 이제 그 출처가 명확해졌습니다. 여전히 업로드한 버전을 보유하고 있지만, 명예를 위해 출처를 명시했습니다. 자세한 내용은 자원 섹션의 iLustMix(v3)를 참조하세요. 또한 해당 믹스의 다른 버전들도 존재하며, 몇 가지를 테스트할 계획입니다. 다만 v9는 매우 다른 변화를 보여주고 있어 저는 꽤 마음에 듭니다.
Danbooru 또는 e621의 트리거 키워드 세트를 사용하여 흥미로운 캐릭터, 옷, 행동을 테스트할 때는 먼저 이 자원에 명시된 "iLustMix"를 확인하여 Illustrious 내에 포함되어 있는지 확인한 후, 골치 아픈 시도를 하기 전에 진행합니다.
Illustrious LoRA를 생성하기 위해 주제에 맞는 이미지 세트를 선택하는 것이 결과를 목표에 맞추는 데 도움이 되었습니다. 그런 다음 Illustrious를 사용하여 Z-Image 대상 이미지를 생성했고, 이 중 218개를 사용했습니다. 무작위 동작 세트를 위해 시드를 통해 포즈를 결정한 후, 의도적인 포즈, 표정, 방향, 마스크 착용/미착용 상태와 다양한 옷차림을 포함시켜 창의성을 탐색할 수 있는 충분한 기본을 마련했습니다.
이미지는 초점에 맞춰 자른 후, 남아 있는 아티팩트는 제거했습니다. 저는 다양한 랭크와 알파 값으로 3세트를 20에포크씩 훈련시켰으며, 각각 약 6,000스텝을 넘겼고, 세부 정보가 우수한 32/1을 최종 선택했습니다. 그 후 유연성을 확인하기 위해 수천 장의 이미지를 생성하고, 다시 설계하여 나머지 이미지 174장에서 218장으로 확장했으며, 최종적으로 33에포크, 7,194스텝에 도달했습니다. (트레이너인 OneTrainer는 0부터 인덱싱하므로, 결과적으로 7,193은 실제로 7,194스텝을 의미합니다.)
너무 많은 정보인가요? 왜 계속 읽고 계신 거죠? :P~
Gwen Stacy는 1965년 12월에 출판된 마블 코믹스의 《어마징 스파이더맨》 #31에서 처음 등장했습니다. 이 사실을 알게 되는 것은 흥미로운데, 저는 오랫동안 스파이더맨 팬이었지만, 다음에 언급할 스파이더-버스 영화가 나올 때까지 Gwen을 몰랐기 때문입니다.
이 LoRA가 표현하려는 캐릭터는 “스파이더맨: 스파이더-버스를 넘어” 출시 전의 이 허구적 캐릭터의 미학을 부활시키고자 하며, 현대적 미학과 3D의 광택을 더한 버전입니다.
눈에 띄는 이미지를 생성하려면 많은 세부 사항을 추가하고, 당신에게 당연해 보이는 것들도 설명해야 합니다. 색상, 느낌, 질감을 구체적으로 기술하세요.
저는 종종 이미지의 본질을 재현하기 위해 훈련에 사용한 캡션을 사용하지만, 이번에는 이미지가 수동으로 프롬프트되었기 때문에, 인터넷에서 다양한 행동과 장면의 스파이더-Gwen(Stacy) 이미지를 수집해joy-captioning을 통해 자세한 설명을 생성하고, 필요에 따라 캡션을 조정하여 예시용 프롬프트를 만들어냈습니다.
v1.1은 10,027스텝에 도달하며, 동일한 배치에서 개선된 이미지 세트를 사용하여 모델을 3D가 아닌 일러스트레이션 방향으로 유도합니다.




















