Muscular Women - Wan
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
비디오의 여성 주인공에게 근육을 추가합니다. 이 모델은 Wan 2.1과 Wan 2.2 모두에서 잘 작동합니다. 이 LoRA는 0.25에서 4.0 이상까지 강도 범위를 가진 슬라이더처럼 사용할 수 있으며, 높은 값에는 아래에서 설명할 부작용이 있습니다.
업데이트: 최상의 결과를 얻으려면 내 워크플로우를 시도해 보세요. 이 워크플로우는 제가 내 모델을 사용해 모든 영상을 제작할 때 사용하는 방식이며, Wan 2.1 모델로 생성된 LoRA를 사용해 Wan 2.2에서 훌륭한 결과를 제공합니다.
버전 2
이 텍스트의 대부분은 버전 2를 반영하여 다시 작성되었습니다. 모델의 동작 방식에 너무 많은 변화가 있었기 때문에 변경 사항을 버전 노트에만 기입할 수 없었습니다. 버전 1을 사용해 왔다면, 아래 설명을 다시 읽어보세요. 도움이 될 수 있습니다.
중요: 이 모델은 100% 허구적이며, 실제 인물의 이미지와는 전혀 관련이 없습니다. 모델의 데이터셋은 정지 이미지 체크포인트에서 생성되었으며, 이후 오직 AI 렌더링만을 사용해 진화했습니다. 이 모델 제작 과정에는 실제 인물이나 AI 생성 인물의 이미지가 한 번도 사용되지 않았습니다.
핵심 문구는 "근육질의 여자"로, "근육질의 여자가 공원을 걷고 있다"는 의미입니다.
- 0.25 - 0.75: 규칙적으로 운동하는 체력 좋은 여자로, 약간 근육질이 보입니다.
- 0.75 - 1.50: 규칙적으로 운동하고 웨이트 트레이닝을 하는 명확히 근육질인 여자입니다.
- 1.5 이상: 근육질의 빌더 수준이지만, 3.0 이상에서는 신체에 약간의 과포화 현상이 나타납니다.
포화도와 움직임 감소의 단점을 피하기 위해 프롬프트 힌트를 사용하면 더 나은 결과를 얻을 수 있습니다. Wan 2.2는 이 LoRA에 대해 프롬프트 설명을 매우 잘 따릅니다. 간단한 변경으로 "극도로 근육질인 여자"라고 말할 수 있으며, 더 구체적인 세부 사항을 추가할 수도 있습니다. 그러나 '빌더(bodybuilder)'라는 단어는 Wan과 함께 사용할 때 주의해야 합니다. 이 단어를 사용하면 얻게 될 포즈와 움직임에 영향을 줄 수 있습니다. Wan은 빌더 대회와 자세에 대해 알고 있으며, 프롬프트에 이 단어를 사용하면 그 영향이 영상에 나타납니다. 또한 Wan은 장면의 맥락을 이해한다는 점도 인지해야 합니다. 장면이 웨이트 트레이닝을 하는 헬스장이라면, 레스토랑 같은 장소에서 동일한 프롬프트와 시드를 사용했을 때보다 훨씬 더 근육질로 나타납니다.
이 모델은 유방 크기를 약간 증가시킵니다. 그러나 크게 변화시키지는 않습니다. 유방 크기를 더 크게 변경하려면 프롬프트와 추가 LoRA를 결합하면 도움이 됩니다. 이 근육질 LoRA는 다른 LoRA와 잘 어울립니다.
마지막 프롬프트 팁: Wan 2.2와 그 분리된 모델 파이프라인을 사용하면 고임계 노이즈와 저임계 노이즈에 서로 다른 값을 사용할 수 있어 다양한 결과를 얻을 수 있습니다. 고임계 노이즈 파이프라인의 변경은 영상의 전반적인 움직임과 장면 내 인물 및 객체의 전체 형태에 영향을 줍니다. 일반적으로 고임계 노이즈 파이프라인에서는 매우 높은 LoRA 값을 피하는 것이 좋습니다. 이는 영상의 움직임에 해를 줄 수 있기 때문입니다. 저임계 노이즈 파이프라인의 변경은 영상의 최종 외관과 세부 사항에 영향을 미칩니다. 여기서 값을 높이면 움직임을 변화시키지 않으면서 강력한 LoRA 효과를 얻을 수 있지만, 과포화 현상이 발생할 수 있으므로 주의해야 합니다.
제 경험에 따르면, 모델은 약 2.00까지 가장 자연스럽게 보이며 움직임과 포화도 변화가 거의 없습니다. 4.00까지(고·저 임계 노이즈 모두) 사용해도 자연스러운 움직임과 선명한 세부 사항이 유지됩니다. 저임계 노이즈 파이프라인의 값이 이보다 더 높아지면 이미지가 무너지기 시작합니다. 더 극단적인 효과를 원한다면, 고임계 노이즈 값을 5.00 이상으로 올리고 저임계 노이즈 값을 약 1.5~2.0으로 유지하면, 결과는 선명하고 과포화되지 않은 상태를 유지할 수 있었습니다.
제 샘플 영상에는 각각 사용된 강도 값이 레이블로 표시되어 있어 효과를 확인할 수 있습니다. 원하는 외관을 얻을 때까지 원하는 값을 자유롭게 조정해 보세요.
버전 2 LoRA 훈련에 대한 참고사항: 버전 1을 더 많이 사용할수록 얼굴의 과포화 현상이 점점 더 성가셨습니다. 이 버전에서는 동일한 약 200장의 이미지 데이터셋을 사용했지만, comfyui 노드를 활용해 모든 얼굴을 투명한 사각형으로 자동 마스킹했습니다. 머리카락은 여전히 보이며, 이미지의 다른 부분은 전혀 변경되지 않았습니다. 제 캡션은 모두 매우 간단했고, 버전 1에서 발견한 편향을 방지하기 위해 몇 가지 변형만을 사용했습니다:
근육질의 여자 초상화. 그녀의 얼굴은 가려져 있다. (그녀는 허리에 손을 얹고 있다.) (그녀의 주먹은 쥐어져 있다.)
마지막 두 문장은 선택 사항이었으며, 필요에 따라 이미지에 추가했습니다. 데이터셋 이미지 중 너무 많은 것이 주먹을 쥔 채 허리에 손을 얹은 빌더 자세를 취하고 있었고, 이로 인해 생성된 영상들이 같은 편향을 반복했습니다. 버전 2는 이 문제를 거의 해결했습니다. 놀랍게도, 20개의 에포크 중 단지 3번째 에포크를 게시했습니다. 제한된 캡션과 넓은 데이터셋을 사용했음에도 불구하고 Wan이 얼마나 빠르고 강력하게 모델을 학습했는지 놀라웠습니다. 이렇게 낮은 에포크 수로, 이 모델은 LoRA를 사용하지 않았을 때와 마찬가지로 장면의 움직임과 기타 세부 사항을 잘 보존하고 있어 매우 좋은 징후입니다. 모든 샘플을 게시한 후, LoRA 없음부터 4.0 이상까지 동일한 클립과 프롬프트를 사용한 일련의 영상을 업로드할 예정입니다. 이를 통해 움직임과 세부 사항의 변화를 직접 확인할 수 있습니다.
모두가 강한 여성들의 이 강렬한 묘사를 즐겁게 감상하길 바랍니다.
