OneTrainer - how to use with float16

세부 정보

파일 다운로드

모델 설명

우선, Stable Cascade LoRA 훈련 with OneTrainer | Civitai의 튜토리얼에 정말, 정말 감사드립니다. 이해하기 어려웠지만, 마침내 작동하게 되었네요 :)

걱정하지 마세요! RTX 3060 Ti 8GB VRAM에서 잘 작동합니다. 저는 오래된 Ryzen 7에 32GB RAM을 사용하고 있습니다(LoRA 훈련 및 워크플로우 실행).

작동하는 LoRA:
Stable Cascade Beksinski - v2.0 | Stable Diffusion LoRA | Civitai

프리셋 및 워크플로우는 ZIP 파일로 첨부했습니다.

자, 시작해봅시다!

JSON(프리셋 파일) 설정을 다음 폴더에 넣으세요.

단계별로:

저는 드라이브 L에 이미지와 txt 파일을 두고 있습니다. bfloat32는 정말 재미있지만, 제 GPU에서는 너무 느리므로 모두 f16로 전환했습니다(bf16 아님).

저는 BLIP을 사용하여 데이터셋 도구로 캡션을 생성하고, 캡션의 첫 번째 단어로 트리거 단어를 설정했습니다.


캡션 팁: 먼저 BLIP을 사용해 태그와 캡션으로 첫 번째 줄을 만들고, 그 다음 wd14 캡션을 새 줄로 추가하세요. 결과:

"beksinskiart, a painting of a man kneeling down in the sand
traditional media, fire, no humans, solo, border"

더 긴 캡션이 필요하다면, BLIP 또는 BLIP2 모델에서 max_tokens을 추가해야 합니다.

마지막 창:

테스트 워크플로우:

일반 워크플로우:

좋은 하루 되세요!

훈련 후 다음 프롬프트와 함께 제 워크플로우를 사용하세요:

"beksinskiart, a painting of a man kneeling down in the sand
traditional media, fire, no humans, solo, border"

이렇게 결과를 얻을 수 있습니다:

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.