InstaPic

세부 정보

파일 다운로드

모델 설명

InstaPic

이 체크포인트의 목표는 소셜 미디어 콘텐츠 제작에 최적화된 고품질 이미지를 생성하는 것입니다. 이 통합은 제가 학습한 LoRA 기반으로 이루어졌기 때문에, 이 설명에는 LoRA의 세부 사항도 포함되어 있습니다.


테스트

이미지 보기


모델 버전 및 학습 세부 정보

학습 개요:

개발 과정에서 총 네 가지 별개의 버전이 학습되었습니다. 각 버전은 다른 접근법과 데이터셋을 사용했습니다. 그러나 버전 1혼합 버전(V1+V3) 만이 공개됩니다. 혼합 버전은 단일 V1보다 우수한 결과를 보여주기 때문입니다.

[InstaPic V1 - 기본 버전]

핵심 학습 사양:

  • 데이터셋: 전문적인 포스트 프로덕션을 거친 600장의 정제된 실제 이미지

  • 랭크: 256 (~4.4GB LoRA 파일 생성)

  • 학습 도구: 최적화된 파라미터를 적용한 Diffusion Pipe

  • 초점: 인스타그램 스타일 콘텐츠 및 소셜 미디어 미학

  • 해상도 최적화: 수직 인스타그램 형식에 맞춰 학습

높은 랭크(256)는 품질 유지 능력을 실험하기 위해 진행한 연구였습니다. 이 원본 버전은 인스타그램 스타일 생성의 기반을 마련합니다.

[InstaPic 혼합 버전(V1+V3) - 향상된 에디션]

고급 결합 학습:

  • 기반: 버전 1의 데이터셋

  • 향상: 버전 3의 SDXL 강화 학습 데이터와 결합

  • 품질: 단일 V1보다 우수한 결과

  • 학습 방식: 포괄적인 스타일 커버리지를 위한 통합 학습

[버전 V2 및 V4 - 실험용 에디션]

  • V2: 고용량 학습 실험(17,000장 이미지, 저해상도)

  • V4: StyleGAN 및 VTON 데이터셋과의 다중 소스 융합

  • 상태: 실험용만 - 공개 예정 없음

  • 목적: 향후 버전을 위한 연구 및 개발


사용 가능한 모델 형식

공개 버전:

InstaPic V1 (원본):

  • 랭크 256 - 4.4GB - 원본 기반 모델

InstaPic 혼합 버전(V1+V3) - 권장:

  • FP16 - 최대 품질의 전체 정밀도 버전

  • FP8 E3M4FN - 품질을 유지한 최적화된 압축 버전

SDXL 스타일 LoRA:

  • InstaPic Style SDXL - Big Love SDXL 모델을 사용한 이미지-이미지 변환을 통해 V1 이미지로 추가 학습된 버전. 세부 표현 및 SDXL 최적화 품질 개선

사전 통합된 Qwen 이미지 기반 모델:

기존 LoRA가 내장된 즉시 사용 가능한 통합 버전:

  • BF16 (전체 정밀도) - 최대 품질, 파일 크기 큼

  • Q8 (고품질) - 품질과 효율성의 우수한 균형

  • Q6 (균형형) - 적절한 품질과 중간 압축

  • Q4 (효율형) - 허용 가능한 품질로 가장 빠른 추론


🧩 프롬프트 템플릿 (데이터셋 스타일)

우수한 품질을 얻으려면 다음 데이터셋 캡션 스타일에 기반한 템플릿을 사용하세요:

1nst4p1c [상세한 머리카락 설명]을 가진 여자, [구체적인 의상 아이템]을 입고, 
[구체적인 포즈/자세]를 취한 채 [상세한 장소]. 
그녀는 [표정]을 하고 [손/신체 위치]. 
[신체 노출/의상 세부사항]. 
배경은 [구체적인 요소가 포함된 상세한 배경 설명]. 
조명은 [조명 유형]이며 [조명 효과]. 
전체 미학은 [미학 설명]. 
이미지는 [구성 세부사항]으로 잘 구성되었고, 
카메라 각도는 [구체적인 각도]로, 대상에 대해 [방향]을 바라보며 촬영되었습니다. 
초점 깊이는 [초점 깊이 설명]이며, [초점 세부사항].

예시 (데이터셋 스타일):

1. 침실 캐주얼

1nst4p1c 긴 검은 머리카락을 가진 여자, 흰색 크롭탑과 레이스 반바지를 입고, 컴퓨터를 무릎에 올린 채 침대 위에 다리를 꼬고 앉아 있다. 표정은 중립적이며 손가락은 키보드 위에 가볍게 놓여 있다. 몸은 대부분 노출되어 있고, 크롭탑으로 복부가 드러나 있다. 목뼈에 작은 문신이 보인다. 배경에는 흐릿한 스트링 라이트와 책이 놓인 나무 선반이다. 조명은 부드럽고 확산되어 피부에 따뜻한 톤을 만든다. 전체 미학은 캐주얼하고 약간 유혹적이다. 이미지는 심도가 얕아 여자가 선명하게 포커싱되고 배경은 부드럽게 흐릿하다. 카메라 각도는 약간 위에서 아래를 향해 촬영되었다.

2. 도시 루프탑

1nst4p1c 긴 물결 모양의 붉은 머리카락을 가진 여자, 검은 가죽 재킷과 찢긴 청바지를 입고, 루프탑 가장자리에 서 있다. 표정은 중립적이며 손은 난간에 얹혀 있다. 몸은 관찰자 쪽으로 약간 기울어져 있지만 시선은 카메라를 향한다. 손목에 작은 별 문신이 보인다. 배경은 흐릿한 도시 조명과 콘크리트 건물, 금속 구조물이다. 조명은 부드럽고 확산되어 일몰의 따뜻한 황금빛 톤을 띤다. 전체 미학은 도시적이고 약간 날카롭다. 이미지는 여자가 선명하게 포커싱되고 배경은 부드럽게 흐릿하다. 카메라 각도는 눈높이로 대상을 직시한다.

3. 수영장 주변

1nst4p1c 풀풀한 긴 금발 머리를 가진 여자, 플로럴 비키니 상의와 하의를 입고 수영장 가장자리에 앉아 있다. 표정은 중립적이며 몸을 뒤로 기울이기 위해 손으로 몸을 지지한다. 다리는 물에 부분적으로 잠겨 있다. 배경은 푸른 수영장 물과 흐릿한 야자수, 수영장 옆 가구들이다. 조명은 밝은 자연광으로 피부에 하이라이트를 만든다. 전체 미학은 여름스럽고 편안하다. 이미지는 심도가 얕아 여자가 선명하게 보인다. 카메라 각도는 약간 위에서 아래를 향해 촬영되었다.

4. 산업 환경

1nst4p1c 긴 검은 머리카락을 가진 여자, 검은 비키니 상의와 피시넷 스타킹을 입고, 콘크리트 벽 근처에서 포즈를 취하고 있다. 표정은 중립적이며 손은 얼굴 근처에 놓여 있다. 몸은 대부분 노출되고 피시넷 스타킹이 구성에 질감을 더한다. 배경은 흐릿한 공사 현장, 주황-갈색 벽, 금속 발판이다. 조명은 부드럽고 확산되어 강한 그림자가 없다. 전체 미학은 캐주얼하면서도 약간 날카롭다. 이미지는 여자가 선명하게 포커싱되고 배경은 부드럽게 흐릿하다. 카메라 각도는 약간 위에서 아래를 향해 촬영되었다.

5. 자연 야외

1nst4p1c 긴 어두운 머리카락을 가진 여자, 검은 줄무늬가 있는 노란 수영복을 입고 물가 바위 근처에 서 있다. 표정은 중립적이며 손은 몸 옆에 놓여 있다. 몸은 대부분 노출되고 수영복은 몸에 꼭 맞게 입혀 있다. 배경은 흐릿한 바위, 물, 자연 식물이다. 조명은 부드러운 자연광으로 피부 전체에 균일한 조명을 제공한다. 전체 미학은 미니멀리즘적이고 자연스럽다. 이미지는 여자의 몸이 관찰자 쪽으로 약간 기울어져 있지만 시선은 카메라를 향한다. 심도는 얕고 여자가 선명하게 포커싱되며 배경은 부드럽게 흐릿하다.

핵심 데이터셋 요소 (품질에 매우 중요):

  • 구체적인 의상 세부사항(비키니 상의/하의, 크롭탑 등)

  • 정확한 포즈 설명(다리를 꼬고 앉다, 무릎을 꿇다, 서 있다 등)

  • 신체 노출 진술("몸이 대부분 노출됨", "오직 ~만 착용" 등)

  • 산업/도시 배경(공사 현장, 콘크리트, 금속 등)

  • 조명은 항상 "부드럽고 확산됨"

  • 항상 "잘 구성됨" 표현 포함

  • 구체적인 카메라 각도(약간 위에서, 아래를 향해)

  • 심도는 항상 명시됨

LoRA 추천:

최상의 결과를 위해 혼합 버전(V1+V3)을 사용하세요. 이 버전은 원본 V1보다 훨씬 우수한 품질을 보여줍니다.


최적의 해상도 설정

권장 인스타그램 해상도:

  • 스토리/리일: 1080 x 1920 (9:16 비율)

  • 대안 수직형: 1088 x 1920 (학습 최적화)

  • 포스트: 1080 x 1350 (4:5 비율)

  • 정사각형 포스트: 1080 x 1080 (1:1 비율)

고품질 해상도 (16의 배수):

  • 1536 x 1024 - 가로형

  • 1024 x 1536 - 세로형

  • 1536 x 864 - 와이드형

  • 864 x 1536 - 탈형

  • 1152 x 1536 - 대안 세로형

  • 1536 x 1152 - 대안 가로형

해상도 가이드라인:

  • 모든 해상도는 16의 배수여야 최적의 처리가 가능합니다.

  • 스크린도어 효과를 방지하기 위해 과도한 고해상도는 피하세요.

  • 진정한 인스타그램 미학을 위해 수직 형식을 선호하세요.

  • 이 모델은 높이 > 너비 비율에서 가장 잘 작동합니다.

  • 다양한 콘텐츠 유형을 위해 여러 비율을 테스트하세요.


권장 샘플러/스케줄러 조합

표준 ComfyUI (내장):

Euler Ancestral + 스케줄러:

  • euler_ancestral + beta

  • euler_ancestral + kl_optimal

  • euler_ancestral + simple

DEIS 3M + 스케줄러:

  • deis_3m + beta

RES4LYF 커스텀 노드 필요:

참고: 이 조합은 ComfyUI에 RES4LYF 커스텀 노드 설치가 필요합니다.

Res 2S + 스케줄러:

  • res_2s + simple

  • res_2s + beta

  • res_2s + beta57

  • res_2s + bong_tanget

DEIS 3M + 고급 스케줄러:

  • deis_3m + beta57

Lightning 모델 통합 (8단계):

샘플 이미지에서 확인된 Lightning 8단계 모델과 호환 — 품질을 유지하면서 초고속 생성 제공.

설치 참고사항:

beta57, bong_tanget 스케줄러 및 일부 고급 샘플러를 사용하려면 ComfyUI 환경에 RES4LYF 커스텀 노드를 설치하세요.

품질 고려사항:

  • Beta 스케줄러: 일반적으로 부드러운 그라데이션 제공

  • Simple 스케줄러: 빠른 추론과 우수한 품질

  • KL_optimal: 세부 텍스처에 최적

  • Beta57: 강화된 Beta 스케줄러 (RES4LYF 필요)

  • Bong_tanget: 독특한 예술적 효과를 위한 실험적 스케줄러 (RES4LYF 필요)


사용 가이드라인

트리거 단어:

1nst4p1c - 프롬프트의 항상 시작 부분에 포함하세요.

인스타그램 최적화 프롬프트 구조:

  1. 트리거 단어: 1nst4p1c

  2. 주체 및 스타일: 인스타그램 인플루언서, 캐주얼 셀피, 라이프스타일 사진

  3. 구성: 수직 프레임, 클로즈업, 미디엄 샷, 전체 신체

  4. 인스타그램 요소: 핸드폰 노출, 링라이트, 모던한 배경

  5. 조명: 자연광, 부드러운 조명, 골든아워, 링라이트 효과

  6. 미학: 인스타그램 필터 스타일, 소셜 미디어용 완성, 인플루언서 스타일


기술 사양

학습 인프라:

  • 주요 도구: Diffusion Pipe

  • 기반 아키텍처: SD 1.5/SDXL 모델과 호환

  • 최적화: 인스타그램 특화 스타일링 및 구성

  • 포스트 프로세싱: 소셜 미디어 향상 파이프라인

성능 특성:

  • 메모리 사용량: 4.4GB (V1 원본) / 가변 (혼합 버전) / 가변 (SDXL)

  • 최적 해상도: 16의 배수인 모든 해상도

  • 추론 속도: 표준 30-40단계, Lightning 모델 사용 시 8단계

  • 스타일 일관성: 인스타그램 미학에 높은 신뢰성


품질 특징

인스타그램 미학:

  • 진정한 소셜 미디어 스타일링

  • 모바일 사진 촬영 감각

  • 모던한 구성 기법

  • 소셜 미디어 컬러 그레이딩

  • 인플루언서 스타일 포즈

기술적 우수성:

  • 수직 형식 최적화

  • 선명한 포커싱과 자연스러운 심도

  • 일관된 조명 및 노출

  • 전문 모바일 사진 촬영 시뮬레이션

  • 스크린도어 효과 방지 최적화

  • 빠른 생성을 위한 Lightning 모델 호환


시스템 요구사항 및 종속성

ComfyUI 요구사항:

  • 표준 설치: 기본 ComfyUI 환경

  • RES4LYF 커스텀 노드: 고급 스케줄러(beta57, bong_tanget) 및 일부 샘플러 사용시 필수

  • 설치 방법: RES4LYF 문서에 따라 정확히 설정하세요

스크린도어 효과 방지:

  • 높이 1920 이상의 해상도는 피하세요

  • 권장 샘플러/스케줄러 조합을 사용하세요

  • 아티팩트가 나타나면 CFG 스케일을 테스트하세요

  • 고해상도에서 텍스처 불규칙성을 주의 관찰하세요

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.