Bucketing downscaler (Downscales and sorts images to expected bucket sizes)

세부 정보

파일 다운로드

모델 설명

이것은 버킷을 계산하고 이미지를 가장 가까운 가장 큰 버킷으로 다운스케일링하는 간단한 스크립트입니다. 데이터셋 테스트 용도 전용이며, 업로드 크기 제한을 우회하려는 경우가 아니면 훈련에 사용하지 않는 것이 좋습니다...

또한, 저는 일반적으로 PowerShell을 사용하지 않기 때문에 이 스크립트에는 버그가 있을 가능성이 높습니다.

이제 이 스크립트를 V2로 업데이트했습니다. 이전에는 프리뷰만 생성했지만, 이제 원본 이미지를 버킷별로 분류합니다. V3에서는 자르기 기능이 추가되었고, V4에서는 자르기 위한 정렬 옵션이 도입되었습니다.

V4

자르기 및 채우기용으로 상/하/중앙, 좌/우/중앙 정렬 옵션이 추가되었습니다. 위, 아래, 중앙을 원하면 각각 U, D, C를 입력하고, 좌, 우, 중앙을 원하면 L, R, C를 입력하세요.

동작 방식은: 좌 정렬은 이미지의 시작 부분을 좌측에 정렬하고, 오른쪽 부분을 자르거나 오른쪽을 흰색으로 채웁니다.

V3

몇 가지 버그를 수정하고, 생성된 테스트 이미지의 가장 큰 측면을 자르는 중앙 자르기 옵션을 추가했습니다. 이를 통해 이미지가 가장 큰 호환 버킷에 완벽하게 맞춰지면서, 가능한 한 가장 적은 양의 이미지를 자르게 됩니다.

이렇게 하면 이론적으로 다운스케일된 이미지를 훈련에 사용할 수 있지만, 여전히 사용 전에 이미지를 검토/선명하게 조정/필터링하는 것을 추천합니다.

원본 전체 해상도 데이터셋은 꼭 보관하세요!

V2:

몇몇 사용자들이 스크립트가 원본 이미지를 예상 버킷으로 정렬할 수 있는지 묻길래, 3가지 유형의 하위 폴더를 생성하는 출력 폴더를 추가했습니다. 바로 버킷에 맞게 다운스케일(또는 업스케일 저품질로)된 이미지, 버킷별로 정렬된 원본 이미지, 그리고 버킷을 제대로 채우기 위해 업스케일이 필요한 원본 이미지입니다. 다운스케일된 이미지는 프리뷰용이며, 훈련에 사용하지 마세요.

이렇게 보일 것입니다:

이미지가 PNG가 아닌 경우 무시되고, 대신 PNG 복사본이 생성되어 사용됩니다. 원본 이미지가 이미 PNG라면 이동됩니다.

V1:

이 스크립트의 목적은 데이터셋 이미지가 다운스케일 과정에서 너무 많은 디테일을 잃지 않는지 확인하는 것입니다. 미래에 재사용할 수 있도록 가능한 한 고해상도로 이미지를 유지하는 것이 가장 좋습니다. 다운스케일된 이미지를 사용할 필요는 없습니다. 이 방법으로 훈련을 하면 아무런 이점이 없습니다.

스크립트는 버킷 파라미터를 묻습니다. LORA Easy 학습 스크립트에서는(코하야-ss는 확신하지 못함) 기본값은 다음과 같습니다:

SD1.5의 경우:

  • 학습 해상도: 512
  • 최소 해상도: 256
  • 최대 해상도: 1024
  • 단계: 64

SDXL의 경우(다를 수 있음):

  • 학습 해상도: 1024
  • 최소 해상도: 512
  • 최대 해상도: 2048
  • 단계: 128

스크립트는 재귀적이며 하위 폴더의 모든 이미지를 자동으로 가져옵니다. 또한 변환 부분을 제거하는 것을 잊어버려서 대부분의 이미지 형식을 받아서 PNG로 출력합니다.

스크립트의 작동 방식은 이미지의 폭과 높이 비율에 대해 가장 큰 가능한 버킷을 계산한 후, 이미지를 다운스케일하고 중앙에 정렬하며, 남은 공간이 있으면 흰색으로 채우는 것입니다.

사용 방법:

  1. 폴더에 스크립트를 넣습니다.

  2. 해당 폴더 안에 이미지 폴더를 넣습니다.

  3. PowerShell 스크립트를 마우스 우클릭하고 실행을 클릭합니다.

  4. 각 요구 값을 입력하고, 각 입력 후 엔터를 누릅니다.

  5. 엔터를 누르면 하위 폴더의 모든 이미지에 대해 새롭게 리사이즈된 복사본이 생성됩니다.

  6. 이미지 품질을 확인하세요. 어떤 이미지라도 품질이 나쁘거나 디테일이 너무 많이 사라졌다면, 원본 이미지로 돌아가 자르거나 데이터셋에서 제거하세요. 기억하세요: 모든 빈 공간, 불필요한 요소, 흰색 배경의 한 픽셀이라도 캐릭터의 얼굴 디테일을 더 세밀하게 표현하는 데 사용될 수 있습니다. 특히 풀바디 이미지에는 주의하세요. 이들은 다운스케일 시 디테일 손실이 특히 심합니다.

  7. 작업이 끝나면, 다운스케일된 이미지를 삭제하세요. 원래 고해상도 이미지가 완벽하다면, 이 이미지들은 훈련에 사용하지 마세요.

참고: 특별한 권한이 필요하지 않기를 희망하지만, 제 환경은 다소 커스터마이징되어 있어 요청할 수 있습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.