meishi-pix2realistic-f1kontext-lora

세부 정보

모델 설명

저의 주된 초점은 고전 게임의 픽셀아트를 현실적인 렌더링으로 변환하는 것입니다. 다른 유형의 픽셀아트는 시험해보지 않았습니다(제 학습 데이터셋은 완전히 고전 게임과 제 팬아트로 구성되어 있습니다). 제 목표는 현실성을 유지하면서 원본 이미지의 외관과 분위기를 가능한 한 정확하게 재현하는 것입니다(물론 이는 제 개인적인 의견입니다). 예를 들어, 아케이드 게임 "Commander"의 캐롤을 살펴보세요. 그녀는 아름다움, 매력, 그리고 근육질의 체형을 모두 풍깁니다. 이는 현실적인 캐릭터에 비키니나 가죽 자켓을 입히는 것만으로는 결코 달성할 수 없는 것입니다.

지금, Kontext의 뛰어난 기능과 LoRa의 미세 조정을 통해 이 작업의 7090%를 달성할 수 있습니다. 현재 제가 이상적이라고 여기는 현실적인 팬아트를 만들기 위해서는 여전히 1030%의 수작업 조정이 필요합니다.

위 이미지는 비교적 자명하지만, 몇 가지 추가 설명을 드리겠습니다.

원본 이미지의 투명 채널은 인덱스 색상에서 보라색이므로, Kontext 이미지는 약간 사진적인质地와 인형 같은 질감을 갖습니다. 이 LoRa는 자연스럽지 않더라도 원본 이미지의 색상 체계를 따르려고 시도합니다.

58x72 픽셀의 원본 이미지라도 이 LoRa는 우수한 결과를 생성합니다(원본 이미지를 업스케일링하는 것이 LoRa를 사용하는 것보다 훨씬 큰 영향을 미칩니다). 그러나 가능하다면 원본 이미지를 약 512픽셀까지 업스케일링하면 더 나은 결과를 얻을 수 있으며, 효과가 명확히 드러납니다.

“먼저 RGB로 변환하고 나중에 업스케일링”이라는 표현은 원본 이미지가 8비트 픽셀 이미지이며, 업스케일링 옵션이 기본적으로 “세부사항 보존(업스케일링)”으로 설정되어 있음을 의미합니다. 이 업스케일링은 별도의 절차를 필요로 하지 않으며, 워크플로에 단순히 노드를 추가하기만 하면 됩니다.

“먼저 업스케일링하고 나중에 RGB로 변환”하는 방법은 “근접(단단한 엣지)” 방법과 동일한 효과를 발생시키며, 이 업스케일링 방법이 가장 우수한 결과를 제공합니다. (이것은 학습 데이터셋에 매우 의존적이며, 다른 사람이 훈련한 LoRa에는 적용되지 않을 수 있으므로 이 점을 유념해 주세요.)

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.