Gemini, prompt generator
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
사용자 정의 LLM 프롬프트를 사용하여 이미지를 분석하고 i2v 모델에 적합한 형태로 구조를 프롬프트로 출력합니다.
+Hunyuan에서도 사용할 수 있지만, 카메라 움직임과 관련된 프롬프트는 제외하는 것을 권장합니다.
또한, API 키를 ComfyUI_windows_portable\ComfyUI\custom_nodes\comfyui-ollamagemini\config.json 경로의 JSON 파일에 입력하세요.
25.05.15 - Gemini Pro 버전의 무료 이용권이 더 이상 사용 불가능해졌으므로, 이제 Flash 버전(2.0 flash 또는 2.5 flash)만 사용해야 합니다.
25.05.26 - 현재 최신 Gemini Flash 버전은 gemini-2.5-flash-preview-05-20입니다.
[변경 로그]
25.08.23/Gemini I2V 프롬프트 for Wan2.2 V2 (txt 파일)
i2v용으로 한 Jailbreak 프롬프트를 수정했습니다. 테스트는 Gemini 2.5 Pro 및 2.5 Flash 모델의 전신 노출된 여성 이미지를 기반으로 수행되었습니다. 다만, 영어로 텍스트를 입력하면 대부분 검열될 가능성이 높습니다. -> 영어가 아닌 다른 언어로 텍스트 요청을 하세요.
25.07.30/Gemini I2V 프롬프트 for Wan2.2 V1 (txt 파일) [프롬프트 검열됨]
Gemini 2.5 Pro/2.5 Flash 모델에서도 NSFW 이미지를 분석할 수 있습니다.
이 프롬프트는 NSFW RP 프롬프트의 일종으로, 높은 수준의 검열 완화를 목표로 하여 RP처럼 작동합니다.
25.07.01/Gemini 비디오/이미지 캡셔닝 UI 베타
이 도구는 큐를 사용하여 여러 비디오 및 이미지 파일을 처리합니다. 3단계 캡셔닝 파이프라인(개별 프레임, 종합 요약, 최종 재작성)을 통해 각 파일에 대해 깔끔한 .txt 캡션과 상세한 .json 로그를 생성합니다.
프로세스에 완전한 제어권을 가집니다. FPS 또는 총 프레임 제한을 통해 프레임 샘플링을 조정할 수 있으며, 모든 프롬프트를 맞춤 설정하고 템플릿으로 저장할 수 있습니다. 매우 긴 파일을 위한 선택적 비디오 분할 모드도 제공됩니다.
레이트 제한 오류를 피하고 작업이 완료되도록 여러 API 키와 모델을 자동으로 순환하는 강력한 백업 시스템이 포함되어 있습니다. API 지연 및 동시 작업자 설정을 통해 성능을 세밀하게 조정할 수도 있습니다.
직관적인 GUI와 실시간 로깅으로 모든 것을 관리할 수 있습니다. 모든 설정은 종료 시 저장되고 시작 시 다시 로드됩니다.
이 도구를 실행하려면 다음 명령으로 필요한 라이브러리를 설치해야 합니다:
pip install PyQt5 opencv-python google-generativeai
현재 버전에서는 실수로 발생한 논리적 문제로 인해 "시작 처리" 및 "정지 처리" 버튼과 출력 /dir이 불편하게 사용될 수 있습니다. 이는 향후 업데이트에서 개선될 예정입니다.
25.06.30/독립형 Gemini UI v2
UI의 편의성을 개선하였으며, 템플릿에 이제 WAN 2.1 i2i v1.21b 및 FLUX kontext i2i 프롬프트가 포함되었습니다. 이 프로그램을 사용하기 전에 다음 명령으로 필요한 라이브러리를 설치해야 합니다: pip install customtkinter google-generativeai pillow pyperclip googletrans==4.0.0-rc1 requests
25.05.30/Wan2.1 I2V용 v1.21b
i2v 업데이트: 정밀한 액션 제어(새로운 문법/구조), 움직임 집중을 위한 카메라 영향 감소; NSFW 거부 가능성 증가.
25.05.21/독립형 Gemini UI (v1.1) - 기존 ZIP 파일이 업데이트되었습니다. 최신 버전이 필요하다면 다시 다운로드하세요.
기본 프롬프트가 수정되어 gemini-2.0-flash 및 gemini-2.5-flash-preview-04-17 버전 모두 정상적으로 사용할 수 있게 되었습니다.
그러나 NSFW 이미지 분석은 gemini-2.0-flash에서만 가능합니다(그러나 가끔 2.5 flash도 가능함). 분석이 실패하는 경우도 있을 수 있습니다. (이러한 경우 분석을 다시 시도하세요. 반드시 성공합니다.)
또한 최종 프롬프트 번역 기능이 추가되었습니다. 따라서 기존 설치 명령은 아래 명령으로 변경됩니다.
pip install google-generativeai customtkinter Pillow tkinterdnd2-Universal googletrans==3.1.0a0
25.05.17/독립형 Gemini UI
이 프로그램은 ComfyUI 워크플로우와 완전히 독립적으로 Google의 Gemini를 활용하기 위한 전용 사용자 인터페이스를 제공합니다.
왜 별도의 UI인가요?
이 도구는 ComfyUI에서 이미지 분석을 수행할 때 흔히 겪는 문제, 즉 WAN(또는 기타 생성 모델)의 언로딩 문제를 해결하기 위해 개발되었습니다. 이 언로딩 과정은 다시 이미지 생성으로 전환할 때 큰 지연을 초래합니다. Gemini를 사용하여 이미지 분석을 독립형 UI로 수행하면, ComfyUI 내에서 주 생성 모델을 로드한 채로 유지할 수 있어 시간을 절약하고 워크플로우 효율을 높일 수 있습니다.
기본 프롬프트 (gemini_app_settings.json 통해)
앱과 동일한 폴더에 제공된 gemini_app_settings.json 파일을 포함하면, 기본 프롬프트 세트(예: "v1.2a wan2.1 i2v" 또는 지정된 기본값)가 자동으로 로드됩니다. 물론 이 파일을 수정하거나 UI 내에서 직접 사용자 정의 프롬프트를 사용할 수 있습니다.
시작하기 - 설치
이 앱을 실행하려면 몇 가지 Python 라이브러리를 설치해야 할 수 있습니다. 명령 프롬프트(CMD) 또는 터미널을 열고 다음 명령을 입력하세요:
pip install google-generativeai customtkinter Pillow tkinterdnd2-Universal
실행 방법
시스템에 Python이 설치되어 있는지 확인하세요.
위의 pip install 명령을 사용하여 필요한 라이브러리를 설치하세요.
기본 프롬프트용 prompts.json 파일(보유한 경우)을 Python 스크립트와 동일한 디렉토리에 두세요.
스크립트 실행: 보이는 콘솔 창으로 실행하려면 python gemini_ui.py
NSFW 이미지 분석
NSFW 이미지를 분석할 경우, "시스템 프롬프트" 필드의 가장 아래에 관련 컨텐츠 설명을 추가하세요.
[**사용자 입력**: (당신의 프롬프트)]
=====
25.05.14/v1.0b i2v용 Joy caption
완전한 무검열 이미지 분석 및 i2v 프롬프트 생성은 JoyCaption을 사용하여 이루어집니다. 생성되는 자연스러운 움직임은 독특하며, 일부 경우 이전에 거의 완벽한 무검열 버전이 확립된 Gemini 2.0 Flash만큼의 유동성을 달성하지 못할 수 있습니다.
huggingface 데모: https://huggingface.co/spaces/fancyfeast/joy-caption-beta-one
github: https://github.com/fpgaminer/joycaption
25.05.05/i2v용 v1.2a, start-end용 v1.1a, Framepack용 v1.0a
이 버전은 최근 개정된 커스텀 노드에 맞춰 업데이트되었으며, NSFW 이미지 또는 프롬프트의 분석을 보장합니다.
+Manager에서 찾을 수 없었던 일부 커스텀 노드를 수정했습니다. 더 이상 커스텀 노드 설치로 인해 불편함을 느끼지 않게 되었습니다.
+ollamamini 커스텀 노드의 최신 버전이 필요합니다.
25.04.18/start/end용 v1.0
최종 프롬프트가 지나치게 길어지는 문제를 해결하고, 시작 및 종료 프레임 간 전환의 일관성과 시각적 연결성을 개선하며, 번역 노드를 추가했습니다.
25.04.18/FramePack용 v1.0
매우 간단한 프롬프트를 생성합니다.
https://github.com/lllyasviel/FramePack
25.04.14/i2v용 v1.1
지나치게 길고 불필요한 최종 프롬프트로 인한 문제를 수정하고, 연속 API 호출을 피하도록 조정했습니다.
*25.04.15/v1.1a - 번역 노드 추가
25.03.19/v1.0
LLM 프롬프트에 단일 잘못된 기호가 존재하는 문제를 수정했습니다. 이는 사소한 변경이지만, 영어 외의 언어로 텍스트를 입력할 때 발생할 수 있는 문제를 약간 개선할 수 있습니다. 또한, 스트림 옵션의 기본 설정이 ON에서 OFF로 변경되었습니다.
25.03.25/start-end 프레임용 (베타) → 베타+ (일부 프롬프트 수정으로 결과 개선)
kijai 워크플로우
시작 및 종료 이미지를 분석하여 i2v 시작-종료 워크플로우에 적합한 프롬프트를 최종 생성합니다. 그러나 이미지나 움직임에 따라 종료 프레임이 제대로 작동하지 않을 수 있습니다. (추가 움직임을 정확히 입력할 수 있다면, 기존 v1.0 워크플로우를 사용하여 중간 움직임을 강화할 수 있습니다.)


