QGO - PromptingReal

세부 정보

모델 설명

안녕하세요 세상!

현실적인 사진을 만들어봅시다

지난 업데이트 이후로 시간이 좀 지난 것 같네요. 이번 버전은 지난 번과는 확실히 달라졌습니다. 그건 이 모델이 웹사이트 내 다른 모델들에 비해 반드시 혁신적이라는 뜻은 아니며, 결국 합병(modification)이기 때문이지만, 몇 가지 매우 구체적인 방향성에 집중해 보았습니다:

  1. LoRA나 임베딩 없이도 높은 수준의 사실감을 구현

    좋은 기초를 갖추면 나중에 이 기반 위에서 더 과감하게 실험할 수 있습니다.

  2. 제한된(작은) 음성 프롬프트가 가능하게 설계

    비슷하게, 작은 음성 프롬프트는 종종 가장 현실적인 결과를 만들어냅니다. 이후에 원하는 아우라나 임베딩을 추가해도 충분히 가능합니다.

  3. 이러한 제약 조건 안에서 포즈/손/다른 특징들이 일관성 있게 유지되도록 함

  4. 프롬프트만으로 조명과 어둠의 강도에 충분한 제어 가능

    조명/노이즈 오프셋에 좋은 LoRA들이 충분히 있으며, 기본적으로도 이미 괜찮은 기능이 내장되어 있습니다.

  5. ChatGPT가 제공하는 가장 극단적인 와일드카드 리스트에도 반응할 수 있도록

    지역, 시간대, 옷감/소재, 개념 등의 무작위 목록을 로컬 GPT에서 생성(및 보강)해 사용하는 것을 권장합니다.

권장 VAE(기본 포함 X): vae-ft-mse-840000-ema-pruned

- 고해상도 기반을 권장합니다: 예를 들어 얼굴 사진의 경우 640x896

- 가능한 한 hires.fix 또는 유사한 구현을 사용하세요: 일반적인 상황에서는 노이즈 감소 값 0.3~0.5가 적절합니다. 다양한 ESRGAN 업스케일러도 좋은 결과를 줍니다. 여기 예시에서 사용된 모델은 x1_ITF_SkinDiffDetail_Lite_v1이지만, 다른 훌륭한 옵션도 있습니다.

- 너무 시간이 많이 소요되는 샘플러(예: 대부분의 예시에 사용된 것들)를 반드시 사용할 필요는 없습니다.
예시 생성 시점에는 SDE Karras에 일시적으로 빠져 있었으나, 지금은 2M Karras @ 15~20 단계로 돌아왔으며, 이것이 보통의 기준이자 결과적으로 hires.fix와 함께 사용해도 충분히 훌륭합니다.

* 일부 예시 프롬프트는 음란한 이미지를 생성할 수 있음을 주의하세요. 이를 방지하려면 음성 프롬프트를 추가해 주세요. 실제 음란 이미지 예시는 별도로 업로드된 앨범을 확인해 주세요.

** 메타데이터에 기재된 모델은 QGO-3002a이며, 이는 QGO-PromptingReal-v1과 동일한 모델입니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.