Vision Realistic DiT

세부 정보

파일 다운로드

모델 설명

비전 리얼리스틱 모델 개요

저는 HunyuanDiT-v1.2를 기반으로 한 최신 체크포인트 모델을 소개하게 되어 기쁩니다. 이 모델은 고품질의 사진처럼 사실적인 이미지를 생성하기 위해 80,000스텝 이상 학습되었습니다.

모델 세부 정보:

  • 종류: 사진처럼 사실적인 모델
  • 트리거 단어: 필요 없음
  • 중국어 지원: 없음
  • 출력: 실제 사진과 매우 유사한 고세부, 고해상도 이미지

학습에 사용된 설정:

  • GPU: A6000
  • 데이터셋: 5,000장의 스톡 사진과 제작한 맞춤형 데이터셋의 조합
  • 배치 크기: 2
  • 최적화기: AdamW
  • 스케줄러: Cosine
  • 학습률: 1e-5
  • 에포크: 100에포크 목표
  • 캡션 생성: Mixed WD14 및 BLIP
  • 학습 시간: 27시간 이상 (경험: 불량; 향후 학습은 미정)

빠른 가이드 및 파라미터:

  • VAE: SDXL
  • 샘플러: dpmpp_2m
  • 스케줄러: sgm_uniform (최상의 결과를 위해 권장)
  • 샘플링 단계: 25+
  • CFG 스케일: 7

더 나은 결과를 위해 ComfyUI 사용을 권장합니다:

tensor.art에서 무료 GPU 가속으로 이용 가능

중요: NSFW/성인용 콘텐츠를 프롬프트에 포함하지 마세요. 이는 신뢰할 수 없는 결과를 초래할 수 있습니다. 또한, SD3 및 DiT 모델 모두에 대해 짧은 프롬프트가 더 효과적입니다.

참고:

이 모델은 병합되거나 수정된 모델이 아닙니다. 원본 Realistic Vision을 미세 조정한 모델입니다. 일부 사용자들이 모델 댓글 섹션에 잘못된 정보를 퍼뜨리고 있습니다. 질문이 있거나 더 자세한 정보를 원하시면 제 Discord 서버에 참여하거나 댓글에 의견을 남겨주세요. 시간을 내어 주셔서 감사합니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.