Retro Comic Flux

세부 정보

모델 설명

레트로 만화 플럭스

레트로 만화 플럭스는 공공영역 이미지만을 수동으로 수집, 자르고 향상시킨 데이터셋으로 학습된 Flux LoRA입니다. 저는 약 50장의 이미지를 사용하여 3번 반복, 15에포크, 학습률 0.0001로 학습했습니다. 모든 이미지는 Joy Caption Batch를 사용하여 캡션을 추가했습니다.

이 모델은 매우 실험적이며, 이 스타일의 동물과 차량에 대한 고품질 이미지를 확보하는 데 어려움을 겪었습니다. 따라서 현재는 인물 이미지에 주로 적합합니다. 캐릭터와 배경 장면을 함께 묘사하면 가장 잘 작동합니다. 손과 눈은 때때로 어려움을 겪습니다. 데이터셋에 없는 요소가 포함되면 일반적인 AI 일러스트 스타일로 기본 설정됩니다.

최상의 결과를 얻으려면 DEIS 샘플러를 사용하세요.

v1: 초기 모델은 저해상도 소스 이미지로 학습되었으며 텍스트 처리 능력이 제한적이었습니다.

v2: 이 버전은 원래의 공공영역 이미지와 구입한 공공영역 자료에서 추출한 고화질 만화 스캔 이미지를 모두 포함합니다. TensorBoard 분석을 기반으로 학습 과정을 650스텝으로 최적화하여 수렴과 과적합 사이의 최적 지점을 찾았습니다. 결과적으로 텍스트 생성 능력이 향상되고 전반적인 성능이 개선된 더 유연한 모델이 완성되었습니다.

v2 사용 팁: 프롬프트에서 "halftone"을 사용할 때, 단색 출력을 방지하기 위해 "colorful"을 함께 포함하세요. 생성된 모든 이미지에는 ComfyUI 워크플로우 데이터가 메타데이터에 포함되어 있습니다. CivitAI 갤러리에서 노드 아이콘을 클릭하면 2단계 생성 워크플로우를 복사할 수 있으며, 이를 직접 ComfyUI에 붙여넣어 동일한 결과를 재현할 수 있습니다.

이전 LoRA들과 매우 유사한 설정을 사용했기 때문에 시간과 간결함을 위해 자세한 설명은 생략하겠습니다. 간단한 스타일에는 낮은 학습률, 적은 반복 횟수, 고품질 데이터가 가장 효과적입니다.

이미지 선택 시 신중을 기했으며, 각 이미지를 Photoshop에서 전처리하여 생동감 있는 색상을 강조하고 황변을 줄이며 대비를 증가시켰습니다. 이를 통해 일관된 컬러링을 유지할 수 있었고, 학습 품질 향상에 도움이 되었다고 생각합니다. 이 과정에서 일부 훈련 데이터의 대사 버블 내 텍스트를 제거하여 유연성을 높이고 Flux가 맥락을 이해하도록 도왔습니다. 프롬프트에 명시적으로 "empty speech bubble"이라고 적으면 잘 작동합니다. 더 깊이 들어가고 싶다면 이미지 캡션 생성기를 사용해 모방하고자 하는 스타일을 설명해 보세요. 이미지에는 풍부한 캡션이 포함되어 있으며, 모델은 자연어에 잘 반응합니다.

이 리소스를 즐기신다면 BUZZ ⚡️를 보내주시면 제가 계속 실험하고 공유할 수 있습니다. 다운로드 후 갤러리에 이미지를 공유해 주세요. 갤러리에 공유하면 시스템이 창작자에게 BUZZ를 제공하여 생성 및 학습을 지원합니다.

트리거 키워드: 'c0m1c' 'comic book panel'

권장 강도: 0.7 - 0.9

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.