M2F Transformation
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
M2F/TSF 만화 시퀀스를 생성합니다. 이는 일반적인 풍경 비율 3:2(1216x832)에서 3인물 시퀀스를 생성하지만, 16:9 비율(1344x768)이나 초광각(1536x640)에서는 더 긴 시퀀스를 생성합니다. 2인물("before after")샷도 매우 훌륭하게 만들 수 있으며, 정사각형이나 세로 비율에서는 대부분 이 정도만 얻을 수 있습니다. 넓고 초광각 이미지에서는 5~6명의 인물까지도 일관된 시퀀스로 생성할 수 있습니다.
또한 F2F 변환 시퀀스도 생성할 수 있으며, 강도를 약간 낮추면 더욱 잘 나옵니다. 4.0 및 5.0 버전용으로 몇 가지를 갤러리에 추가했습니다.
권장 강도: 0.8
태그: gender transformation 최근에는 보통 masterpiece, gender transformation, man, woman, androgynous로 시작합니다. 인물 수는 해상도와 포즈에 크게 의존하며, 성별 범위는 주로 남성적/여성적 태그의 포함 여부에 따라 달라집니다. 대부분의 모델은 여성 쪽으로 매우 강하게 편향되어 있어, 명시적으로 강하게 유도하지 않으면 남성을 포함하지 않습니다.
2girls, 1boy 등의 태그는 별로 유용하지 않다고 느낍니다. LoRA 없이 체크포인트에서 시도해 봤지만, 대부분 이러한 태그에 별로 주의를 기울이지 않는 것 같았습니다. 그러나 다른 태그가 거의 없는 경우, 이 부분을 조정해 볼 수 있습니다.
선택 사항: magical effects, drinking potion, glowing book 등. 이 유형의 요소를 충분히 학습했는지라, 모델이 무엇을 해야 할지 스스로 유추할 수 있습니다.
부정적 태그: people in background — 모델이 가능한 모든 구석에 사람을 반사시키려 하기 때문입니다.
결과를 공유해 주세요! 여러분의 창작물을 보고 싶습니다.
버전 5 업데이트 🎉
v4보다 일관되게 더 나은 결과를 내기 위해 다양한 버전을 시도해 보았고, 마침내 제대로 된 버전을 만들었다고 생각합니다. 여러분에게 어떻게 작동하는지 알려주세요.
버전 가이드:
[1.0] 첫 번째 릴리즈, Pony 전용. 앞을 향해 서 있는 4~5명의 인물을 생성하는 것을 선호하며, 3명 또는 6명도 가능합니다. 사실상 구식이지만, 생성되는 이미지 스타일을 좋아한다면 작업하기 매우 깔끔하고 간단합니다.
[1.5] 첫 번째 Illustrious 버전. 서 있는 정렬된 인물 외에도 다양한 포즈를 더 쉽게 생성할 수 있도록 완화되었습니다. 처리 가능한 캐릭터 다양성이 크게 확장되었고, 일부 마법적 특수 효과도 지원합니다. 실질적으로 모든 면에서 1.0보다 우수합니다.
[2.0] 이 버전은 다른 버전보다 2.5D 경향이 강합니다. 훨씬 더 넓은 개념과 마법적 효과를 학습했으며, 매우 다재다능합니다. 그러나 다양성 때문에 원하지 않는 마법 효과가 나타나지 않도록 부정적 프롬프트를 약간 사용해야 할 수 있습니다.
[3.0] 지팡이, 마법 액체, 신비로운 기기 같은 마법적 소품에 더 많은 학습을 했습니다. 포즈와 장면의 다양성도 증가했습니다. 인물이 더 큰 공간을 차지하므로 시퀀스가 일반적으로 3~4명으로 짧아지며, 2명 또는 5명까지도 가능합니다. 이전 버전보다 강도가 약간 더 강하며, 저는 0.8 또는 0.85에서 실행하는 것을 선호합니다. 이전 버전은 1.0 강도에서 잘 작동했지만, 이 버전은 2.0보다 더 "과도한" 느낌이 날 수 있습니다.
[4.0] 이미지 품질 문제를 정리했고, 더 많은 체크포인트와 호환성이 향상되었습니다. 강도 1.0에서 이미지가 깔끔하게 보이지만, 더 공격적으로 변환을 시도할 때 약간 기묘해질 수 있습니다. 전반적으로 3.0보다 더 다재다능합니다.
[5.0] 제대로 생성하기 어려웠던 이미지를 다음 버전 학습 데이터에 포함시키려 했지만, 그 중 일부가 모델을 혼란스럽게 했던 것 같습니다. 따라서 이 버전은 더 일관된 데이터셋으로 구성되었으며, 더 일관되게 우수한 결과를 내는 것 같다고 느낍니다. 유연성은 줄어들 수 있지만, 그럴지는 아직 모릅니다. 학습 이미지는 과거 버전보다 이미지 품질뿐 아니라 "분위기"에서도 훨씬 나아졌습니다. 진정한 이야기를 전달하는가, 아니면 단지 기술적으로 정확한 것인가.
향후: 이미 매우 성숙한 상태이지만, 더 많은 마법 소품과 아이디어를 추가할 수 있습니다. 좀 더 이상한 오류를 피하기 위해 마법/기술 전용 LoRA로 분리할 수도 있습니다.
이전 버전들이 어떤 결과를 내는지 갤러리를 확인해 보세요!
팁:
LoRA 강도 0.8 또는 0.85가 매우 잘 작동합니다 (2.0 이전 버전은 1.0 강도를 시도해 보세요). 강도를 낮추면 여성 인물만 포함된 시퀀스가 생성될 가능성이 높아지며(그래도 재미있을 수 있음), 더 창의적인 시퀀스나 순서가 뒤바뀐 단계가 나타날 수 있습니다. 강도를 높이면 남성 캐릭터가 더 많이 나타나고, 일반적으로 더 긴 시퀀스를 생성하지만, 너무 높으면 이미지 품질이 저하됩니다.
더 많은 스텝도 시퀀스 품질 향상에 도움이 됩니다(어느 정도까지는). 예를 들어, 15스텝 정도로 깔끔한 이미지와 시퀀스를 생성할 수 있지만, 20, 25, 30스텝이 더 나을 수 있습니다.
낮은 CFG가 LoRA가 더 자유롭게 작동하도록 도와주는 것 같습니다. 대부분의 체크포인트에서 약 4를 선호합니다.
캐릭터 LoRA와 결합하려면, 그 LoRA의 강도를 낮추세요(예: 절반 정도). 모든 인물을 해당 LoRA의 스타일로 만들려고 해서 이 LoRA의 기능과 충돌할 수 있습니다.
태그 "holding object"는 매우 흥미롭습니다. 모델은 자연스럽게 무언가를 삽입하는데, 보통 장면에 잘 어울립니다.
태그 "diorama"도 매우 멋진 효과를 생성합니다.
현실적 또는 반현실적 모델은 도움 없이 안드로기너스 표현을 잘 하지 못합니다. 일러스트 모델이 가장 잘 작동합니다.
배경에 추가 인물을 환상적으로 생성하는 경향이 있습니다. 프롬프트에는
(blurred background)를, 부정적 태그에는(people in background)를 포함시키는 것이 좋습니다.














