Helltaker Style Illustrious
세부 정보
파일 다운로드
모델 설명
시작 프롬프트: (품질 및 스타일 프롬프트)
masterpiece, best quality, amazing quality, flat_color, sharp, (2d, cartoon, toon \(style\):1.2),
(shiny, bloom, glossy, vibrant, edge lighting, volumetric lighting, rim lighting),
스타일 프롬프트/Lora 모델 가중치: 0.7 - 0.8이 적절함
<lora:Offical_Helltaker_Style:0.8>, helltaker_style
[여기에 귀하의 프롬프트를 입력하세요].
저는 캐릭터 프롬프트를 아래에 배치하고, 행동, 옷차림, 배경 등의 요소는 중간에 배치합니다.
제작자 노트:
많은 사람들이 스타일을 학습할 때도 이미지에 상세한 태그를 계속 붙이는 것을 보았습니다. 하지만 이런 작업은 필요 없습니다. 활성화 프롬프트를 사용하거나, 아예 활성화 태그를 생략할 수 있습니다.
스타일을 학습할 때, 당신은 포즈, 캐릭터, 옷차림 등의 개념을 학습하는 것이 아닙니다. 개념은 UNet과 Text Encoder 모두에 의존합니다. 반면, 스타일은 오직 UNet에만 의존하며, 패턴과 색상 인식을 담당합니다.
Text Encoder는 학습 중 이미지에 할당한 태그와 이미지 내용을 연결하여 모델이 각 이미지에 무엇이 있는지 이해하도록 돕습니다. 그러나 스타일 학습에는 필요하지 않습니다. 스타일은 순수하게 시각적 특성이며, 모델에게 어떤 객체나 주제가 있는지 알려줄 필요가 없습니다. 게다가 스타일은 이미지의 일부가 아니라 전체에 영향을 미칩니다.
그러나 만약 당신이 "1boy", "1girl" 또는 이미지에 나타난 모든 세부 사항을 정상적으로 태그한다면, 모델은 이러한 태그를 스타일 자체와 연결하기 시작할 것입니다. 추론 시 이러한 태그를 프롬프트에 사용하면, 모델은 시각적 미학만을 담고자 했음에도 불구하고 그 태그와 관련된 콘텐츠(예: 남자아이, 여자아이)를 우선 생성할 수 있습니다. 이는 학습을 혼란스럽게 만들며, 스타일만을 목표로 했어야 할 학습에 개념 학습이 섞이게 됩니다. 태그를 사용하지 않으면, 스타일은 더 유연하게 유지되어 주제에 관계없이 넓게 적용됩니다.
그러나 일부 캐릭터 모델은 이미지의 스타일에 영향을 줄 수 있습니다. 이는 학습 과정에서 UNet과 Text Encoder를 함께 활용하기 때문입니다.
예시:
어떤 사람이 헨타이 작가의 스타일을 학습했는데, 데이터셋 안에 '선교사 자세'가 여러 번 나타나고 정상적으로 태그되었다고 가정해 봅시다. 그러면 다른 사람이 그 스타일 모델을 사용할 때, 선교사 자세를 생성하면 데이터셋에서 보였던 선교사 자세의 외형을 그대로 재현하게 됩니다. 이는 데이터셋이 정상적으로 태그되었기 때문이며, 스타일 모델의 유연성을 해치고 사용자들이 동일한 각도에서 동일한 선교사 자세만 반복하게 만듭니다.






