AmateurTrigger_XL

세부 정보

파일 다운로드

모델 설명

여기서 내가 가장 큰 프로젝트를 20일간 진행해 왔고, 여러 테스트를 거쳤습니다.

요약하자면, LoRA라는 이름이 시사하듯, 저는 매우 초보적이고 솔직하고 수제 같은 분위기를 목표로 했습니다.

제가 원하는 렌더링 방식을 익히기 위해 기술을 찾는 데 오랜 시간이 걸렸습니다.

무엇보다도, 하나하나 이미지를 다운로드하는 데 시간을 낭비하고 싶지 않았습니다. 그래서 제가 아마추어/수제 콘텐츠를 확실히 찾을 수 있는 몇몇 유명 사이트를 위한 이미지 스크래퍼를 프로그래밍했습니다. 단지 링크를 입력하기만 하면, 스크립트가 모든 페이지의 이미지를 모두 다운로드할 수 있었습니다.

그런 다음 많은 이미지를 확보하는 것은 좋지만, 여전히 품질이 필요합니다. 저는 훈련 품질을 떨어뜨릴 수 있는 못된 이미지들의 덩어리를 만들고 싶지 않았습니다. 그래서 다운로드 폴더를 정리하기 위한 또 다른 스크립트를 설계해야 했습니다. ‘무게’, ‘크기’, ‘품질’로 정렬하는 것이었습니다. 이미지를 각각의 폴더에 정리한 후, 상위 등급의 이미지만 루트 폴더로 돌아오게 했습니다.

결국 몇 분 안에 15,000장의 이미지를 다운로드했고, 그중 단지 5,000장만 남겼습니다. 하지만 어쨌든 LoRA에는 5,000장이 정말 많습니다.

자동 정렬 이후에 수동으로 또 한 번 정렬을 해야 했습니다.

저는 확실히 5,000장의 이미지로 LoRA를 훈련하고 싶었기 때문에 ‘파인 튜닝’ 형태의 훈련을 선택했습니다. 학습률은 약 2e-05, 네트워크 차원은 96, 알파는 16으로 설정했고, 총 11,800스텝을 훈련했습니다(2번에 나누어 훈련. 파란색 곡선은 첫 번째 훈련입니다).

캡션은 JoyCaption Alpha 2를 사용하여 생성했습니다(5,000장의 이미지에 대해 오랜 시간이 걸렸지만, overnight에 완료되었습니다).

모든 캡션은 "Descriptive | Medium-length" 프리셋을 사용했습니다.

BigLustiMix_rebirth를 사용하여 훈련했지만, 일반적으로 Lustify/BigASP2 베이스를 가진 모든 모델과 호환됩니다.

체크포인트에서 많은 공간을 차지하는 경향이 있기 때문에 강도는 약 0.8로 유지하는 것을 권장합니다. 하지만 그것이 저의 목표이기도 했기 때문에 별로 놀랄 일은 아닙니다. 원래 파인 튜닝을 하려 했기 때문입니다.

이 LoRA는 비교적 낮은 압축률과 기본적인 조명을 가진 이미지의 유명한 잡음과 과립 효과를 보여줍니다. 종종 휴대폰 플래시 같은 광원을 사용하지만, 해상도는 손상되지 않습니다. 왜냐하면 이 LoRA를 1024x1024의 표준 해상도가 아닌 1216x1216 해상도로 훈련했기 때문입니다. 이는 SDXL의 일반적인 기준을 약간 초월하는 해상도를 허용합니다.

신체도 훨씬 더 자연스럽고, 자세도 전반적으로 더 솔직하고 진짜처럼 보입니다. ‘완벽’해 보이지는 않습니다.

특정 트리거 토큰은 별로 필요하지 않습니다. 이 LoRA는 소규모 모드보다는 대규모 DLC에 가깝습니다. 가장 빈번한 태그를 알아내려면 LoRA를 메타데이터 분석기에 불러들이는 것을 권장합니다. 또는 제가 만든 스크립트를 사용해도 됩니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.