Fresh Photo (realism eddiemauro-mix)
세부 정보
파일 다운로드
모델 설명
사전에 주의할 점
Stable Diffusion의 작동 방식을 이해해야 합니다. 모델을 실행하기 위한 인터페이스로 Automatic1111을 추천합니다.
이 모델은 SD 1.5 기반으로, 완전하지 않음을 인지해야 합니다. 안정적인 출력을 위해 수많은 테스트를 거쳐야 했습니다. 더 나은 기반 모델(예: 새로운 SD XL)이 등장하면 모델을 향상시킬 계획입니다.
이 모델은 체크포인트 데이터셋입니다.
병합 모델이므로 때때로 NSFW 이미지를 생성할 수 있음을 유의하세요. 부정적 프롬프트에는 단지 "nudes"만 추가하세요.
저는 AI 이미지 생성에 관해 설명하는 인스타그램 계정을 운영하고 있으니, 팔로우해 주시기를 추천합니다: https://www.instagram.com/eddiemauro.design/
소개
FRESH PHOTO (실사형 eddiemauro-mix) 체크포인트: 안녕하세요, 저는 제품 및 자동차 디자이너이며, AI를 이용한 테스트에 매우 기대됩니다. 디자인에 유용한 도구라고 생각합니다.
v1: 실사형 모델을 묶어 만든 제품으로, 다양한 사진 스타일에서 우수한 성능을 발휘합니다. 저는 실사 이미지를 생성할 수 있는 '일반 모델'을 만들고자 했습니다.
v1.5: 프롬프트 품질이 향상되고 일관성이 좋아졌습니다. 색감이 더 세련되고, 인종 다양성이 더 좋아졌으며, 디테일도 향상됐습니다.
v2.0: 더 많은 디테일, 더 자연스러운 느낌, 더 높은 해상도. 형태에 대한 일관성이 좋아졌으며, 따뜻한 필터 효과는 감소했습니다. 인종 다양성 표현도 더 좋습니다. 일반적으로 v1.5보다 우수하지만, 특정 인물 표현 시 v1.5가 더 나은 경우도 있습니다.
v2.5 (+인패이닝): 전반적으로 v2보다 훨씬 우수합니다.
v2.5 LCM: 전반적으로 v2보다 뛰어납니다. v2.5 일반 모드보다 어둡고, 세부 사항이 더 풍부합니다. Euler-a Normal 또는 LCM Normal로 사용 가능합니다. CFG 1-2, Steps 5-20 설정을 권장합니다. 참고: 이곳의 이미지 예시는 v1.5 CFG로 생성되었으며, Civitai 메타데이터는 정확하지 않습니다.

제 작업을 후원하여 더 나은 품질의 모델 업로드를 도와주실 수 있습니다. 후원 링크는 아래를 참고하세요: https://ko-fi.com/eddiemauro
설치 방법
저는 Stable Diffusion 이미지 생성용 최고의 인터페이스인 Automatic1111을 사용하고 있으므로, 현지 설치 또는 Colab 등의 호스팅 서비스를 통해 온라인으로 사용하는 것을 추천합니다. 온라인으로 설치 방법 안내를 찾을 수 있습니다. 현지 설치를 원하시면 여기 영상 튜토리얼을 참고하세요. 안정적인 환경을 위해 최소 6~8GB VRAM을 갖춘 그래픽 카드(nvidia)를 사용하세요. 이때 'Microsoft Edge'를 사용하는 것이 좋으며, 'Google Chrome'에서는 문제 발생 가능성이 있습니다. 또한 'medvram' 또는 'lowvram' 옵션은 'xformers' 외에도 설치하는 것이 좋습니다(온라인에서 설치 방법 검색 가능).
이 체크포인트 모델을 설치해야만 사용할 수 있습니다.
이미지 생성 시 제 모든 추천을 따라야 하며, 그렇지 않으면 고품질 이미지를 생성하는 것은 불가능합니다. 또한 현재 AI 이미지 생성은 여전히 일관성과 완성도가 떨어지므로, 좋은 결과를 얻기 위해 시간을 투자하고 여러 번 테스트를 반복해야 합니다.
이미지 생성 추천 사항
액티브 토큰/캡션: 프롬프트 시작 부분에 "RAW photo of" 또는 "Analog photo of" 를 넣어 이미지에 더 사실감을 더할 수 있으나, 필수는 아닙니다.
프롬프트 추천: 프롬프트 내부에서 다음과 같은 단어들을 사용하여 이미지 품질을 향상시킬 수 있습니다.
긍정적 공간에서: "Photorealistic, Hyperrealistic, Hyperdetailed, detailed skin, soft lighting, subsurface scattering, realistic, masterpiece, best quality, ultra realistic, 8k, Intricate, High Detail, film photography, soft focus"
부정적 공간에서: "((nsfw)), ((asian)), Japanese, Korean, Chinese, ((disfigured)), ((deformed)), ((extra limbs)), (((duplicate))), ((morbid)), ((mutilated)), out of frame, extra fingers, mutated hands, poorly drawn eyes, ((poorly drawn hands)), ((poorly drawn face)), (((mutation))), ((ugly)), blurry, ((bad anatomy)), (((bad proportions))), cloned face, body out of frame, out of frame, bad anatomy, gross proportions, (malformed limbs), ((missing arms)), ((missing legs)), (((extra arms))), (((extra legs))), (fused fingers), (too many fingers), (((long neck))), tiling, mutated, cross-eye, canvas frame, frame, cartoon, 3d, weird colors, blurry, cgi, 3d, render, sketch, cartoon, drawing, anime, cropped"
또한 제공된 예시 이미지의 메타데이터를 살펴보고 프롬프트를 모사해 보세요. 인종별 인물을 표현할 때는 이 웹사이트에서 인종 그룹을 선택하고 이름을 하나의 이름과 성만 복사하는 방법을 추천합니다.
프롬프트 추천(v2.5): 간단하게 "RAW photo of", "Photo of", 또는 "Analog photo of"만 사용하세요. 긍정적 공간에서, 부정적 공간에서는 "nudes, asian, worst quality, normal quality, bad quallity, text, artifacts, bad eyes, strabismus, deformed, cartoon, render"를 명시하세요. 주로 아시아인을 생성하지만, 이를 원하지 않으면 부정적 프롬프트에 "asian"을 추가하세요.
텍스트 인버전/임베딩 또는 LoRA 추천: "EasyNegative"는 부정적 프롬프트 공간에서 가장 좋은 텍스트 인버전 중 하나입니다. 반드시 사용하세요. 여기에서 다운로드하여 "embeddings" 폴더에 설치하세요. 또한 "Detail Tweaker" LoRA를 사용해 이미지에 더 많은 세부정보를 추가할 수 있습니다. 여기에서 다운로드하여 LoRA로 설치 후 긍정적 프롬프트에 "1"의 값을 주세요. 체크포인트가 풍부한 디테일을 가졌을 때만 사용하고, 최소주의 스타일일 때는 사용하지 마세요. "Detail Tweaker"는 img2img 모드에서 배치 생성 후에만 사용 가능합니다. 다른 LoRA 모델인 "Epi noiseoffset"도 사용해 대비를 높일 수 있습니다.
텍스트 인버전/임베딩 또는 LoRA 추천 (v2.5): 간단하게 유지하세요. 임베딩이나 복잡한 단어를 사용할 필요는 없습니다. 긍정적 공간에서 "Detail Tweaker" LoRA만 사용하고, 이미지에 더 많은 디테일이 필요할 경우에만 활용하세요.
VAE: 대부분은 "vae-ft-mse-840000-ema-pruned"이라는 Stable Diffusion 표준 VAE를 추천합니다. v1-5 및 v2에서는 VAE가 내장되어 있습니다. 사진 스타일은 이미지에 약간의 따뜻한 색조(노란빛)와 색조의 약간의 퇴색이 특징입니다. v1.5 버전은 VAE 내장으로 인해 색감이 더 채도가 높아질 수 있습니다.
Clip Skip: 사실감을 높이려면 1을 사용하세요. 실험용으로만 2를 사용하세요.
Steps 및 CFG: 30-50의 Steps와 6-8의 CFG 스케일을 권장하며, 이상적인 설정은 Steps 30, CFG 7입니다. 향후 모델에서는 이 값이 변경될 수 있습니다. 때때로 CFG Scale 9, Sample Steps 40-50가 우수한 결과를 내기도 합니다.CFG 10 이상과 높은 Sampling Steps는 성능 저하가 발생하므로 주의하세요. v2.5의 경우 Steps 30, CFG 6를 사용하세요. LCM: Euler-a Normal 또는 LCM Normal로 사용 가능합니다. CFG 1-2, Steps 5-20 설정 사용 권장.
Sampler: 주로 "DPM++SDE Karras"를 사용합니다. Euler는 단순하지만 디테일이 적습니다. 다른 샘플러로도 실험해 보세요.
배치(batch): txt2img에서는 4를 설정하여 여러 이미지를 동시에 생성하고 결과를 확인하세요. 고성능 그래픽카드를 사용하는 경우 "Batch size"를 사용하면 동시에 4개의 이미지를 생성할 수 있으나 생성 시간이 늘어납니다. 컴퓨터가 부담을 느끼면 "Batch count"로 변경하여 차례로 4개의 이미지를 생성하세요(동시 생성 아님). 생성 시간은 늘어납니다.
이미지 비율: 512x512, 768x512, 512x768을 권장하지만, 다른 비율로 실험해도 됩니다. 이미지가 너무 커지면 스타일이 손실될 수 있으므로, 더 큰 이미지를 원한다면 txt2img 모드에서 hires.fix 기능을 사용하거나, img2img의 확대 기능 또는 Ultimate SD Upscale 스크립트 확장 + ControlNet을 활용하세요. 또는 GAN 모델로 단순 확대하는 것도 가능합니다.
더 큰 이미지 생성 방법: Stable Diffusion에서 큰 이미지를 생성하는 방법은 네 가지가 있습니다. 온라인에서 방법을 확인할 수 있습니다. 첫 번째 방법 "txt2img hires.fix" 에서는 "4x-UltraSharp" 업스케일 모델을 추천합니다. 여기에서 다운로드하여 ".pth" 파일만 받아 "ESRGAN" 폴더에 설치하세요. hires.fix 옵션에서 "upscale by" 값을 설정하고, "denoise strength"를 "0.5-0.7"로 설정하세요. 두 번째 방법은 txt2img에서 생성된 이미지를 선택하고 img2img 모드로 전환한 후 최소 1.5배 이상 확대하면서 "denoise strength"를 "0.3-0.5"로 설정하세요. 세 번째 방법은 img2img 설정을 그대로 사용하되, ControlNet 확장의 "tile" 모드와 "Ultimate SD Upscale" 스크립트를 활성화하세요. 이 방법은 여기 튜토리얼을 참고하는 것이 좋습니다. 마지막 방법은 생성된 이미지를 txt2img에서 "extras"로 전달한 후, GAN 모델을 선택하여 확대하면 됩니다. "4x-UltraSharp", "4xNMKD-SIAX_200k", 또는 "4xUniscaleV2-Moderate"도 사용 가능합니다. v2.5 버전에서는 "8x-NMKD-Superscale_150000_G" 모델을 사용하세요.
창작의 통제력 향상: 제어한 형태를 생성하고 싶다면 "ControlNet" 확장을 사용하세요. 스케치로도 테스트 가능합니다. "Scribble" 또는 "Lineart" 모드를 활용하세요. 확장을 설치한 후 사용 방법을 익히세요. 온라인에는 관련 영상이 풍부합니다.
이미지 메타데이터에 프롬프트 복사: 예시 이미지를 여기서 다운로드하여 Automatic1111의 "PNG info" 탭에 넣어 사용하세요.
예시 프롬프트:
긍정적 프롬프트:
RAW photo of Gotzon Otxoa in casual clothes, little smile, small details, photorealistic, ultra-realistic photo, 8k uhd, dslr, soft lighting, high quality, film grain, Fujifilm XT3, (masterpiece) lora:add_detail:1
금지한 프롬프트(v1.5-2):
RAW photo of Muirgheal MacCarrick with sweater, red hair, Photorealistic, Hyperrealistic, Hyperdetailed, detailed skin, soft lighting, subsurface scattering, realistic, masterpiece, best quality, ultra realistic, 8k, Intricate, High Detail, film photography, soft focus
간단한 부정적 프롬프트:
EasyNegative, ((nsfw)), ((asian)), Japanese, Korean, Chinese.
완전한 부정적 프롬프트:
((nsfw)), ((asian)), Japanese, Korean, Chinese, ((disfigured)), ((deformed)), ((extra limbs)), (((duplicate))), ((morbid)), ((mutilated)), out of frame, extra fingers, mutated hands, poorly drawn eyes, ((poorly drawn hands)), ((poorly drawn face)), (((mutation))), ((ugly)), blurry, ((bad anatomy)), (((bad proportions))), cloned face, body out of frame, out of frame, bad anatomy, gross proportions, (malformed limbs), ((missing arms)), ((missing legs)), (((extra arms))), (((extra legs))), (fused fingers), (too many fingers), (((long neck))), tiling, mutated, cross-eye, canvas frame, frame, cartoon, 3d, weird colors, blurry, cgi, 3d, render, sketch, cartoon, drawing, anime, cropped, Easynegative
Steps: 30-50 사용 (DPM++SDE Karras 기준, 때때로 EulerA로도 사용 가능하나 디테일 감소)
CFG scale: 7-9 (8이 이상적입니다).
"((asian)), Japanese, Korean, Chinese"는 특정 인물 생성 전용일 경우 제거 가능합니다. 수많은 시도와 프롬프트 설정 후, 부정적 공간에서 "EasyNegative" 임베딩이 충분하다는 것을 확인했습니다. v1.5-2.0에서는 더 확장해서 사용하는 것이 좋습니다.
v2 예시 프롬프트:
긍정적 프롬프트:
RAW photo of Isaura Ojeda in casual clothes, little smile, realistic, city streets lora:General-Design\\add_detail:0.7
간단한 부정적 프롬프트:
nudes, asian, worst quality, normal quality, bad quallity, text, artifacts, bad eyes, strabismus, deformed, cartoon, render
Steps: 30-50 (DPM++SDE Karras 사용, 때때로 EulerA도 가능하나 디테일 손실)
CFG scale: 6-7. LCM: Euler-a Normal 또는 LCM Normal로 사용 가능. CFG 1-2, Steps 5-20.
"asian"은 얼굴 생성 시 원하지 않는 경우 제거 가능합니다.
미래 계획
이 모델의 향상을 위해 이미 노력 중입니다. 현재는 512 이미지 비율로 학습했지만, 768(더 큰 비율)로, 또 다른 설정(캡션, 스텝, 에포크 등 변경)으로 시도해볼 계획입니다. 이 버전의 더 나은 모델을 원하신다면 ko-fi에서 지속적인 후원을 부탁드립니다. 더 많은 지지자가 있다면 더 많은 시간을 투자해 모델을 개선할 수 있지만, 그렇지 않으면 제한이 생기고 불가능합니다.

저는 ko-fi 레벨 1 멤버십을 통해 첫 번째 개인 모델인 "eddiemauro scene" 을 출시했습니다. 이는 렌더링용 최소주의 풍경 생성 모델입니다. 개인 모델에 접근하고 싶으시면 후원 및 멤버십 가입을 부탁드립니다. 또한 앞으로 제품 및 자동차 디자인에 초점을 맞춘 더 많은 모델을 업로드할 예정입니다.
라이선스
Stable Diffusion 라이선스는 여기서 확인하세요: 라이선스 링크. 이 구체적인 모델은 실험용으로 사용하길 권장합니다. 다음 사항은 금지됩니다:
허락 없이 이 모델을 서버 또는 공개 온라인 사이트에 업로드하는 것.
허락 없이 이 모델을 직접 사용하여 다른 이름으로 공유하거나, 이미지 생성에 수익을 내는 서비스에 업로드/실행하는 것.
이 모델을 체크포인트 또는 LoRA와 병합한 후 공개하거나 온라인 공유하는 것은 반드시 제게 먼저 문의하세요. 향후에는
이 모델 또는 이 모델을 사용한 병합 모델을 판매하는 것.
지지 방법
제 SNS 계정을 팔로우해 주세요. 작업 과정과 디자인 팁, 도구들을 공유할 예정입니다. 또한 웹사이트를 확인하시고, 디자인 서비스가 필요하시면 프리랜서로 협업 가능합니다.
https://www.facebook.com/eddiemauro.design
https://www.instagram.com/eddiemauro.design




















