Flux Kontext + Gemini for finetuning dataset from few images

세부 정보

파일 다운로드

모델 설명

(이것은 제가 처음 만든 워크플로우이자 첫 번째 업로드이므로, 사용된 노드들이 정리되지 않은 점 사전에 사과드립니다.)

원본 워크플로우: Lovis Odin: https://github.com/lovisdotio/workflow-comfyui-single-image-to-lora-flux

이 ComfyUI 워크플로우는 하나(또는 여러 개)의 이미지를 데이터셋 생성을 위한 여러 개의 이미지로 변환하며, 이를 통해 세부 조정(fine-tuning)에 활용할 수 있습니다.

사용자는 단순히 "inputs" 폴더에 이미지를 두기만 하면 됩니다. 그 후 임의의 이미지가 선택되고, Gemini가 해당 이미지를 분석하여 프롬프트를 생성합니다. 그 중 하나의 임의 프롬프트가 선택되며, 입력 이미지를 기반으로 Flux 컨텍스트를 이용해 새로운 이미지가 생성됩니다. 제 같은 VRAM이 부족한 동료들을 위해 Flux 컨텍스트 GGUF 파일을 로드하는 노드를 추가했습니다.

"ask gemini for text" 노드를 포함하는 패키지 "comfyui_fill-nodes"를 실행하는 데 큰 어려움을 겪었습니다. 최종적으로 제가 도움을 받은 방법은 해당 폴더의 __init__.py 파일을 편집하여 "Gemini"와 관련 없는 모든 행을 삭제하는 것이었습니다. Gemini(또는 다른 LLM) 접근을 위한 더 간단한 노드 패키지를 알고 계신다면 알려주세요!

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.