Gemini, prompt generator

세부 정보

파일 다운로드

모델 설명

사용자 정의 LLM 프롬프트를 사용하여 이미지를 분석하고 i2v 모델에 적합한 형태로 구조를 프롬프트로 출력합니다.

+Hunyuan에서도 사용할 수 있지만, 카메라 움직임과 관련된 프롬프트는 제외하는 것을 권장합니다.

Gemini API 키가 필요합니다. (무료, 링크)

또한, API 키를 ComfyUI_windows_portable\ComfyUI\custom_nodes\comfyui-ollamagemini\config.json 경로의 JSON 파일에 입력하세요.

25.05.15 - Gemini Pro 버전의 무료 이용권이 더 이상 사용 불가능해졌으므로, 이제 Flash 버전(2.0 flash 또는 2.5 flash)만 사용해야 합니다.

25.05.26 - 현재 최신 Gemini Flash 버전은 gemini-2.5-flash-preview-05-20입니다.


[변경 로그]

25.08.23/Gemini I2V 프롬프트 for Wan2.2 V2 (txt 파일)
i2v용으로 한 Jailbreak 프롬프트를 수정했습니다. 테스트는 Gemini 2.5 Pro 및 2.5 Flash 모델의 전신 노출된 여성 이미지를 기반으로 수행되었습니다. 다만, 영어로 텍스트를 입력하면 대부분 검열될 가능성이 높습니다. -> 영어가 아닌 다른 언어로 텍스트 요청을 하세요.

25.07.30/Gemini I2V 프롬프트 for Wan2.2 V1 (txt 파일) [프롬프트 검열됨]
Gemini 2.5 Pro/2.5 Flash 모델에서도 NSFW 이미지를 분석할 수 있습니다.
이 프롬프트는 NSFW RP 프롬프트의 일종으로, 높은 수준의 검열 완화를 목표로 하여 RP처럼 작동합니다.

25.07.01/Gemini 비디오/이미지 캡셔닝 UI 베타

  • 이 도구는 큐를 사용하여 여러 비디오 및 이미지 파일을 처리합니다. 3단계 캡셔닝 파이프라인(개별 프레임, 종합 요약, 최종 재작성)을 통해 각 파일에 대해 깔끔한 .txt 캡션과 상세한 .json 로그를 생성합니다.

  • 프로세스에 완전한 제어권을 가집니다. FPS 또는 총 프레임 제한을 통해 프레임 샘플링을 조정할 수 있으며, 모든 프롬프트를 맞춤 설정하고 템플릿으로 저장할 수 있습니다. 매우 긴 파일을 위한 선택적 비디오 분할 모드도 제공됩니다.

  • 레이트 제한 오류를 피하고 작업이 완료되도록 여러 API 키와 모델을 자동으로 순환하는 강력한 백업 시스템이 포함되어 있습니다. API 지연 및 동시 작업자 설정을 통해 성능을 세밀하게 조정할 수도 있습니다.

  • 직관적인 GUI와 실시간 로깅으로 모든 것을 관리할 수 있습니다. 모든 설정은 종료 시 저장되고 시작 시 다시 로드됩니다.

  • 이 도구를 실행하려면 다음 명령으로 필요한 라이브러리를 설치해야 합니다:

    pip install PyQt5 opencv-python google-generativeai

현재 버전에서는 실수로 발생한 논리적 문제로 인해 "시작 처리" 및 "정지 처리" 버튼과 출력 /dir이 불편하게 사용될 수 있습니다. 이는 향후 업데이트에서 개선될 예정입니다.

25.06.30/독립형 Gemini UI v2
UI의 편의성을 개선하였으며, 템플릿에 이제 WAN 2.1 i2i v1.21b 및 FLUX kontext i2i 프롬프트가 포함되었습니다. 이 프로그램을 사용하기 전에 다음 명령으로 필요한 라이브러리를 설치해야 합니다: pip install customtkinter google-generativeai pillow pyperclip googletrans==4.0.0-rc1 requests

25.05.30/Wan2.1 I2V용 v1.21b
i2v 업데이트: 정밀한 액션 제어(새로운 문법/구조), 움직임 집중을 위한 카메라 영향 감소; NSFW 거부 가능성 증가.

25.05.21/독립형 Gemini UI (v1.1) - 기존 ZIP 파일이 업데이트되었습니다. 최신 버전이 필요하다면 다시 다운로드하세요.

기본 프롬프트가 수정되어 gemini-2.0-flash 및 gemini-2.5-flash-preview-04-17 버전 모두 정상적으로 사용할 수 있게 되었습니다.

그러나 NSFW 이미지 분석은 gemini-2.0-flash에서만 가능합니다(그러나 가끔 2.5 flash도 가능함). 분석이 실패하는 경우도 있을 수 있습니다. (이러한 경우 분석을 다시 시도하세요. 반드시 성공합니다.)

또한 최종 프롬프트 번역 기능이 추가되었습니다. 따라서 기존 설치 명령은 아래 명령으로 변경됩니다.

pip install google-generativeai customtkinter Pillow tkinterdnd2-Universal googletrans==3.1.0a0

25.05.17/독립형 Gemini UI

이 프로그램은 ComfyUI 워크플로우와 완전히 독립적으로 Google의 Gemini를 활용하기 위한 전용 사용자 인터페이스를 제공합니다.

왜 별도의 UI인가요?

이 도구는 ComfyUI에서 이미지 분석을 수행할 때 흔히 겪는 문제, 즉 WAN(또는 기타 생성 모델)의 언로딩 문제를 해결하기 위해 개발되었습니다. 이 언로딩 과정은 다시 이미지 생성으로 전환할 때 큰 지연을 초래합니다. Gemini를 사용하여 이미지 분석을 독립형 UI로 수행하면, ComfyUI 내에서 주 생성 모델을 로드한 채로 유지할 수 있어 시간을 절약하고 워크플로우 효율을 높일 수 있습니다.

기본 프롬프트 (gemini_app_settings.json 통해)

앱과 동일한 폴더에 제공된 gemini_app_settings.json 파일을 포함하면, 기본 프롬프트 세트(예: "v1.2a wan2.1 i2v" 또는 지정된 기본값)가 자동으로 로드됩니다. 물론 이 파일을 수정하거나 UI 내에서 직접 사용자 정의 프롬프트를 사용할 수 있습니다.

시작하기 - 설치

이 앱을 실행하려면 몇 가지 Python 라이브러리를 설치해야 할 수 있습니다. 명령 프롬프트(CMD) 또는 터미널을 열고 다음 명령을 입력하세요:

pip install google-generativeai customtkinter Pillow tkinterdnd2-Universal

실행 방법

  1. 시스템에 Python이 설치되어 있는지 확인하세요.

  2. 위의 pip install 명령을 사용하여 필요한 라이브러리를 설치하세요.

  3. 기본 프롬프트용 prompts.json 파일(보유한 경우)을 Python 스크립트와 동일한 디렉토리에 두세요.

  4. 스크립트 실행: 보이는 콘솔 창으로 실행하려면 python gemini_ui.py

NSFW 이미지 분석

NSFW 이미지를 분석할 경우, "시스템 프롬프트" 필드의 가장 아래에 관련 컨텐츠 설명을 추가하세요.

[**사용자 입력**: (당신의 프롬프트)]

=====

25.05.14/v1.0b i2v용 Joy caption
완전한 무검열 이미지 분석 및 i2v 프롬프트 생성은 JoyCaption을 사용하여 이루어집니다. 생성되는 자연스러운 움직임은 독특하며, 일부 경우 이전에 거의 완벽한 무검열 버전이 확립된 Gemini 2.0 Flash만큼의 유동성을 달성하지 못할 수 있습니다.
huggingface 데모: https://huggingface.co/spaces/fancyfeast/joy-caption-beta-one
github: https://github.com/fpgaminer/joycaption

25.05.05/i2v용 v1.2a, start-end용 v1.1a, Framepack용 v1.0a
이 버전은 최근 개정된 커스텀 노드에 맞춰 업데이트되었으며, NSFW 이미지 또는 프롬프트의 분석을 보장합니다.
+Manager에서 찾을 수 없었던 일부 커스텀 노드를 수정했습니다. 더 이상 커스텀 노드 설치로 인해 불편함을 느끼지 않게 되었습니다.
+ollamamini 커스텀 노드의 최신 버전이 필요합니다.

25.04.18/start/end용 v1.0
최종 프롬프트가 지나치게 길어지는 문제를 해결하고, 시작 및 종료 프레임 간 전환의 일관성과 시각적 연결성을 개선하며, 번역 노드를 추가했습니다.

25.04.18/FramePack용 v1.0
매우 간단한 프롬프트를 생성합니다.
https://github.com/lllyasviel/FramePack

25.04.14/i2v용 v1.1
지나치게 길고 불필요한 최종 프롬프트로 인한 문제를 수정하고, 연속 API 호출을 피하도록 조정했습니다.
*25.04.15/v1.1a - 번역 노드 추가

25.03.19/v1.0
LLM 프롬프트에 단일 잘못된 기호가 존재하는 문제를 수정했습니다. 이는 사소한 변경이지만, 영어 외의 언어로 텍스트를 입력할 때 발생할 수 있는 문제를 약간 개선할 수 있습니다. 또한, 스트림 옵션의 기본 설정이 ON에서 OFF로 변경되었습니다.

25.03.25/start-end 프레임용 (베타) → 베타+ (일부 프롬프트 수정으로 결과 개선)
kijai 워크플로우
시작 및 종료 이미지를 분석하여 i2v 시작-종료 워크플로우에 적합한 프롬프트를 최종 생성합니다. 그러나 이미지나 움직임에 따라 종료 프레임이 제대로 작동하지 않을 수 있습니다. (추가 움직임을 정확히 입력할 수 있다면, 기존 v1.0 워크플로우를 사용하여 중간 움직임을 강화할 수 있습니다.)

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.