PVC STYLE for FLUX.1 D.
세부 정보
파일 다운로드
모델 설명
권장 해상도: 단축 측 1152+ 이상, 장축 측 1920+ 이상. 가로는 장면에 초점을 맞추고, 세로는 캐릭터에 초점을 맞춥니다. Hirs 수선은 1.5에서 2까지 활성화할 수 있습니다(선택 사항), 트리거 단어는 필요 없습니다.
학습에 사용된 기본 모델은 Flux.1-Dev입니다.
이 모델의 학습 방식
이 모델은 kohya-ss/sd-scripts를 사용하여 학습되었으며, 이미지는 lllyasviel/webui-forge로 생성되었습니다.
자동 학습 프레임워크는 DeepGHS 팀에서 유지보수하며, 제가 포크했습니다.
우리는 모델의 정확도와 제어성을 균형 있게 유지하기 위해 자동으로 200 에포크를 선택했습니다.
왜 더 나은 이미지만 선택해서 사용하지 않나요?
우리 모델의 전체 과정, 즉 데이터 크롤링, 학습, 프리뷰 이미지 생성 및 게시는 인간의 개입 없이 100% 자동화되어 있습니다. 이는 우리 팀이 진행한 흥미로운 실험이며, 이를 위해 데이터 필터링, 자동 학습, 자동 게시를 포함한 완전한 소프트웨어 인프라를 구축했습니다. 따라서 가능하다면, 이에 대한 피드백이나 제안을 주시면 저희에게 매우 소중합니다.
왜 원하는 예술 스타일을 정확히 생성할 수 없나요?
현재 학습 데이터는 다양한 이미지 웹사이트에서 수집되었습니다. 완전히 자동화된 파이프라인 내에서 공식 이미지에 포함된 특정 예술 스타일을 예측하는 것은 큰 도전입니다. 따라서 예술 스타일 생성은 학습 데이터셋의 라벨을 기반으로 클러스터링하여 가능한 한 최적의 재현을 시도합니다. 우리는 이 문제를 계속 해결하고 최적화를 추구할 것이지만, 완전히 해결할 수 없는 도전 과제입니다. 예술 스타일 재현의 정확도는 수동으로 학습된 모델의 수준에 비해 낮을 가능성이 높습니다.
다음과 같은 사용자에게는 이 모델 사용을 권장하지 않으며, 이에 대해 사과드립니다:
가장 사소한 세부 사항이라도 원본 예술 스타일에서 벗어나는 것을 용납할 수 없는 분들.
예술 스타일 재현 정확도에 높은 요구를 하는 응용 시나리오를 사용하는 분들.
Stable Diffusion 알고리즘 기반 AI 생성 이미지의 잠재적 무작위성을 받아들일 수 없는 분들.
LoRA를 사용한 예술 스타일 모델 학습의 완전 자동화 과정에 불편함을 느끼거나, 원본 예술적 비전을 보존하려면 예술 스타일 학습은 반드시 수동 작업만으로 이루어져야 한다고 믿는 분들.
생성된 이미지 내용이 자신의 가치관에 반하는 것으로 느끼는 분들.
왜 우리는 자동 학습 프레임워크를 사용하나요?
이미지만 올려두면, 나머지 모든 단계는 완전 자동화되어 감독이 필요 없습니다. 저는 게임을 하거나 친구들과 시간을 보내며, 번거로운 데이터 처리 및 라벨링 작업 없이 완전히 자유로울 수 있습니다. 데이터 처리 및 학습 속도도 매우 빠릅니다. 이 방식의 모델 학습은 저에게 완전한 즐거움입니다.


















