Queratogray Sketch (eddiemauro-mix)

세부 정보

파일 다운로드

모델 설명

사용 전 주의사항

  • Stable Diffusion의 작동 방식을 이해해야 합니다. 저는 모델을 실행하기 위한 인터페이스로 Automatic1111을 추천합니다.

  • 이 모델은 SD 1.5 모델 기반으로 학습되었으므로 완벽하지 않을 수 있음을 인지해야 합니다. 안정적인 생성을 위해 수많은 테스트를 거쳐야 했습니다. 더 나은 기반 모델(예: SD XL)이 출시되면 모델을 업그레이드할 예정입니다.

  • 이는 체크포인트 데이터셋입니다.

  • 저는 AI 이미지 생성에 대한 설명을 인스타그램 계정에서 공유하고 있으므로, 관심 있는 분은 아래 링크를 참고해주세요: https://www.instagram.com/eddiemauro.design/

소개

QUERATOGRAY SKETCH (eddiemauro-mix) 체크포인트: 안녕하세요, 저는 제품 디자이너이자 자동차 디자이너이며, AI를 활용한 디자인 시험에 매우 흥분하고 있습니다. 저는 AI가 디자인 작업에 매우 유용한 도구라고 생각합니다. 저는 애니메이션과 일러스트에 집중하는 제품 디자이너이자 친구인 'Joell Martínez Tenjo'와 협업을 결정했습니다. 그의 회색톤/모노크롬 일러스트 시리즈 'Sketchbook'에서 50개 이상의 스케치 스타일을 선정하고, 이를 기반으로 모델을 학습시켰으며, 다른 모델들과 혼합하여 학습을 정규화하여 그의 최종 스타일을 약 50% 정도 달성했습니다. 그의 프로필은 여기에서 확인할 수 있습니다: https://www.behance.net/queratoilustracion

이 스타일은 주로 인물 이미지를 생성하는 데 중점을 두고 있지만, 다른 LoRA와 조합하여 다양한 대상의 활용을 확장할 수 있습니다.

저의 작업을 후원하고 더 높은 품질의 모델을 업로드하는 데 도움을 주고 싶다면, 아래 링크에서 기부해주세요. 매우 감사하겠습니다: https://ko-fi.com/eddiemauro

설치 방법

  • 저는 Stable Diffusion 이미지 생성을 위한 최고의 UI인 Automatic1111을 사용하고 있으므로, 로컬에 설치하거나 Colab 또는 기타 호스팅 서비스를 통해 온라인으로 사용하는 것을 추천합니다. 온라인에서 설치 방법을 설명하는 튜토리얼이나 동영상을 찾을 수 있습니다. 로컬 설치를 고려 중이라면 이 온라인 튜토리얼을 시청하면 좋습니다. 안정적인 인터페이스를 위해서는 적어도 6-8GB의 VRAM(네이버티아 그래픽 카드)을 보유하는 것이 좋습니다. "Microsoft Edge"로 실행하는 것이 좋으며, "Google Chrome"에서는 문제가 발생할 수 있습니다. 또한 "xformers" 외에도 "medvram"이나 "lowvram" 옵션을 설치해보세요(온라인에서 방법을 검색해보세요).

  • 모델을 사용하기 위해 체크포인트 모델을 설치해야 합니다.

  • 이미지 생성 시 제 모든 권장 사항을 따라야 합니다. 이를 따르지 않으면 좋은 품질의 이미지를 생성하는 것은 불가능합니다. 또한 현재 AI 이미지 생성은 여전히 일관성이 부족하고 완벽하지 않으므로, 시간을 들여 여러 차례 테스트를 해야 한다는 점을 고려하세요.

이미지 생성에 대한 권장 사항

  • 활성화 토큰/캡션: 프롬프트 공간 내에서 첫 번째 단어는 반드시 “sketch artstyle” 를 사용해야 합니다. 이는 필수 조건이며, 지키지 않으면 제대로 작동하지 않습니다.

  • 추가 추천 프롬프트: 프롬프트 내에서 다음과 같은 단어들을 사용하면 이미지 생성 품질이 향상됩니다. 긍정적 공간: “grayscale, monochrome, ((solo))”; 부정적 공간: “out of frame, multiple people, missing fingers, extra digit, fewer digits, (((many people))), blurry, color”. 예시 이미지의 메타데이터를 참고하여 비슷한 프롬프트를 시뮬레이션해보세요.

  • 텍스트 인버전/임베딩 또는 LoRA 도구 추천: 스타일을 보존하려면 부정적 임베딩을 사용하지 마세요. 사용할 경우 스케치 기반 회색톤 일반 스타일로 바뀌게 됩니다. 부정적 프롬프트는 간단하게 유지하는 것이 좋습니다(예시 이미지 참조). 왜냐하면 이는 스타일을 해칠 수 있기 때문입니다. 얼굴과 눈 생성에는 매우 효과적이므로 '얼굴 복원' 또는 기타 임베딩은 필수적이지 않습니다. 만약 부정적 임베딩을 사용할 경우, EasyNegative가 가장 좋은 텍스트 인버전 중 하나로 추천합니다. 여기에서 다운로드하여 "embeddings" 폴더에 복사해 설치하세요.

  • VAE: 스케치 스타일 생성 시 "kl-f8-anime2"를 반드시 사용해야 합니다. 아직 설치되어 있지 않다면 다운로드하여 설치하세요.

  • Clip Skip: 2를 사용하세요.

  • 스텝 및 CFG: 20-40 스텝과 7-8의 CFG 스케일을 권장합니다. 이상적인 값은 스텝 30, CFG 7입니다. 향후 모델에서는 이 값들이 변경될 수 있습니다.

  • 샘플러: 주로 "EulerA" 또는 "DPM++SDE Karras"를 사용합니다. Euler는 더 단순하고 창의적인 결과를 도출합니다. 원한다면 다른 샘플러도 실험해보세요.

  • 배치: txt2img에서 1장 이상의 이미지를 생성하려면 값을 4로 설정해 보세요. 그래픽 카드 성능이 좋은 경우 "배치 크기"를 사용하면 동시에 4개의 이미지를 생성할 수 있습니다(생성 시간은 증가하지만). 하지만 컴퓨터 성능이 부족할 경우, "배치 수"를 사용하여 연속으로 4개 이미지를 생성하는 방법을 사용하세요(동시 생성은 아님). 이 경우 생성 시간은 더 오래 걸립니다.

  • 이미지 비율: 512x512, 768x512, 512x768 비율을 사용해 보세요. 이미지 크기가 크면 스타일이 손상될 수 있으므로, 더 큰 이미지를 원한다면 txt2img 모드에서 hires.fix를 사용하세요. 또는 img2img의 증가 방법, Ultimate SD Upscale 스크립트 확장 + ControlNet, 또는 GAN 모델을 활용한 확대를 이용하세요.

  • 더 큰 이미지 생성: Stable Diffusion에서 큰 이미지를 만드는 네 가지 방법이 있습니다. 온라인에서 방법을 찾아보세요. 첫 번째 방법은 "txt2img hires.fix" 를 사용하는 것이며, 이 경우 "4x-AnimeSharp"라는 확대 모델을 권장합니다. 여기에서 다운로드하여 단일 ".pth" 파일만 다운로드하고, "ESRGAN" 폴더 내에 복사해 설치하세요. hires.fix 옵션에서 "확대 배율" 값을 설정하고, "노이즈 강도"를 "0.5-0.7"로 설정하세요. 두 번째 방법은 txt2img에서 생성된 이미지를 먼저 선택한 후 img2img 모드로 전환하고, 최소한 "1.5배 이상"으로 차원을 늘리며 "노이즈 강도"를 "0.3-0.5"로 설정합니다. 세 번째 방법은 img2img와 동일한 설정을 사용하지만, ControlNet 확장의 "타일" 모드와 Ultimate SD Upscale 스크립트를 활성화하는 것입니다. 해당 방법에 대해 여기의 튜토리얼을 참조하는 것이 좋습니다. 마지막 방법은 txt2img에서 생성된 이미지를 "확장 기능(Extras)"으로 전달한 후 GAN 모델을 선택하고 확대하는 것입니다. "4x-UltraSharp" 모델도 사용 가능합니다.

  • 더 높은 제어력 확보: 원하는 형태에 더 정밀하게 제어하기 위해 ControlNet 확장을 사용하세요. 특히 스케치와 함께 실험해보는 것도 가능합니다. "Scribble" 또는 "Lineart" 모드를 활용하세요. 이 확장을 설치하고 사용법을 익히는 것이 좋습니다. 온라인에서 관련 동영상이 많이 있습니다.

  • 프롬프트를 이미지 메타데이터로 복사: 제 예시 이미지를 여기에서 다운로드하여 Automatic1111의 "PNG info" 탭에 삽입할 수 있습니다.

예시 프롬프트:

긍정적 프롬프트:
A young man, sketch artstyle, grayscale, monochrome, ((solo))

긍정적 프롬프트 (스타일 손실):
A young man, sketch artstyle, grayscale, monochrome, ((solo)), ((masterpiece)), HDR, highly detailed, professional

부정적 프롬프트:
out of frame, multiple people, missing fingers, extra digit, fewer digits, (((many people))), blurry, color

부정적 프롬프트 (스타일 손실):
EasyNegative, (worst quality:2), (low quality:2), (normal quality:2), out of frame, multiple people, missing fingers, extra digit, fewer digits, (((many people))), blurry, color

스텝: 20-40(양호한 결과를 위해 EulerA의 경우 20으로도 충분하며, DPM++SDE Karras를 사용해도 가능하지만 대부분 EulerA가 더 우수합니다).

CFG 스케일: 7-8(이상적은 7).

향후 계획

저는 이미 모델 개선 작업을 진행하고 있습니다. 이 모델은 512 이미지 비율로 학습되었기 때문에, 768(더 큰 비율)과 다른 구성(캡션, 스텝, 에포크 등을 변경)을 시도해볼 계획입니다. 이 버전의 개선된 모델을 원한다면, ko-fi에서 계속 지지해 주세요. 더 많은 사람들이 저를 지원할수록 더 많은 시간을 들여 모델을 학습하고 개선할 수 있지만, 그렇지 않다면 다른 지원이 어렵습니다.

저는 Ko-fi 멤버십 레벨 1 회원을 위한 첫 번째 프라이빗 모델을 런칭했습니다. 이름은 "eddiemauro scene"이며, 레이어링을 위한 가장 민감한 장면 생성 전용 모델입니다. 프라이빗 모델에 접근하고 싶다면, 저를 후원하고 이 멤버십에 가입하세요. 앞으로 제품 및 자동차 디자인 중심의 더 많은 모델을 공유할 예정입니다.

라이선스

Stable Diffusion의 라이선스는 여기에서 확인하세요. 이 모델의 경우, 오직 실험 목적으로만 사용하십시오. 다음 사항은 금지됩니다:

  • 저의 승인 없이 이 모델을 서버나 공개 온라인 사이트에 업로드하는 것.

  • 저의 승인 없이 이 모델을 온라인에서 공유하고, 같은 모델을 다른 이름으로 사용하거나, 이 모델을 업로드한 후 수익을 내는 서비스에서 사용하는 것.

  • 이 모델을 체크포인트나 LoRA와 병합하여 공개하거나 온라인으로 공유하는 것. 반드시 먼저 저에게 문의하세요. 향후에는

  • 이 모델을 판매하거나, 이 모델을 사용한 병합물을 판매하는 것.

후원하기

제 소셜 미디어를 팔로우하세요. 작업 과정과 디자인 팁, 도구 등을 공유할 예정입니다. 또한 웹사이트를 방문하시거나, 디자인 서비스가 필요하신 경우 프리랜서로 일하고 있습니다.

http://eddiemauro.design/

https://www.facebook.com/eddiemauro.design

https://www.instagram.com/eddiemauro.design

https://www.linkedin.com/in/eddiemauro

https://www.behance.net/eadesign1

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.