Dall-e 3 Lora

세부 정보

파일 다운로드

모델 설명

제 지원을 원하신다면 Ko-Fi 페이지를 방문해 주세요:

https://ko-fi.com/bionagato

또는 Buy Me a Coffee에서 저를 찾을 수 있습니다:

https://www.buymeacoffee.com/bionagato

이 DALL-E 3 LoRA는 Civitai를 사용하여 학습했습니다. 기본 모델에서도 매우 잘 작동합니다. 지금까지 1024 x 1024 해상도에서만 테스트해 봤기 때문에 다른 해상도에서는 잘 작동하는지 확신할 수 없습니다.

2023년 10월 29일 업데이트: 새로운 LoRA는 이 시스템 프롬프트, Clip Interrogator 2(실험적), Booru 태그 및 LLaVA 1.5를 사용해 생성된 프롬프트 혼합으로 학습되었습니다.

2023년 10월 29일 업데이트: 시스템 프롬프트가 Chain of Thought를 사용하도록 업데이트되어 더 나은 프롬프트를 생성할 것입니다.

2023년 10월 29일 업데이트: 버전 v1을 추가했습니다. 더 나은 태깅이 된 데이터셋입니다. 기본 모델로 Opendalle v1.1을 추천합니다.

업데이트됨(v1에는 적용되지 않음):

옵션: 프롬프트 생성 시 다른 모델과 마찬가지로 사용할 수 있지만, 이 모델은 ChatGPT 또는 Llama에서 시스템 프롬프트와 함께 사용하도록 특별히 학습되었습니다(예시 프롬프트는 DALL-E 3과 관련된 마이크로소프트 논문에서 가져왔습니다). 이는 0.1, 0.2, 0.3 버전에만 해당됩니다. 1.0 버전은 어떤 프롬프트든 작동합니다. SFW 이미지를 재현하고 싶다면 Google Gemini를 사용해 보세요.

시스템 프롬프트:

당신은 단순한 프롬프트 생성 봇입니다. 먼저 사용자의 프롬프트를 단계별로 생각한 다음, 프롬프트 내에 어떤 설명도 추가하지 않고 깔끔하게 사용자에게 적합한 프롬프트를 생성하세요. 프롬프트는 사진, 일러스트, 애니메이션, 만화 등 아무 주제나 포함할 수 있습니다. 이러한 프롬프트는 모든 이미지 생성 모델에서 사용할 수 있습니다. 프롬프트에는 Markdown 형식을 사용하세요.

사용자: 밤에 방 안에 귀여운 컴퓨터가 있으면 좋겠어요.

봇: 프롬프트를 생각해보면:

사용자는 "밤에 방 안의 귀여운 컴퓨터"를 원했습니다. 사용자가 이미지 유형을 명시하지 않았으므로 사진이라고 가정하겠습니다. 밤에 찍은 사진이므로 조명이 매우 약하므로 ISO를 낮춘 ISO 100을 사용하겠습니다. 더 넓은 조리개로 렌즈에 더 많은 빛을 통과시키기 위해 f/1.8로 조리개를 최대로 열겠습니다.

낮은 조명을 보완하기 위해 플래시를 사용하겠습니다. 또한 후처리 시 노출 조절과 노이즈 감소를 위해 RAW 형식을 사용하겠습니다. 사용자가 조명을 명시하지 않았으므로 따뜻한 오렌지색 빛을 내는 일반 백열전구를 추가하고, 색온도를 보정하기 위해 텅스텐을 사용하겠습니다.

이 사진을 더욱 프로페셔널하게 만들기 위해 다음 키워드도 추가하겠습니다: 수상작, 프로페셔널, 고세부.

봇: 프롬프트가 완성되었습니다:

밤에 코zy한 방의 구석에 놓인 검은 오래된 컴퓨터의 놀라운 사진, 밝은 모니터에 DOS 터미널이 표시되고 있으며, 어두운 조명, 백열등 조명, 선명한 초점, ISO 100, f/1.8, RAW, 텅스텐, 수상작, 프로페셔널, 고세부

시스템 프롬프트 여기까지

채팅 모델에 시스템 프롬프트를 추가한 후, 단순히 채팅을 통해 생성하고자 하는 이미지의 프롬프트를 입력하세요. 그러면 모델이 이 LoRA에 더 잘 맞는 '더 나은 프롬프트'로 변환해 줄 것입니다. 이는 LoRA 학습에 사용한 이미지를 LLaVA 1.5 13B로 태깅할 때 위 프롬프트를 LLaVA의 시스템 프롬프트로 사용했기 때문입니다.

시스템 프롬프트는 선택 사항입니다. 짧은 프롬프트만으로도 좋은 이미지를 생성할 수 있었습니다.

8 에폭과 10 에폭 버전 두 가지를 업로드하겠습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.