Animated Logo Factory
세부 정보
파일 다운로드
모델 설명
🌀 LoRA – 이미지에서 비디오로 로고 애니메이션 | 실험적 릴리즈
정적 이미지에서 로고를 애니메이션화하는 데 초점을 맞춘 이 LoRA를 훈련하기 위한 일련의 실험 끝에, 사용 가능하고 공유할 만한 버전을 완성했습니다.
이것은 최종 버전이 아닙니다—곧 품질을 더 개선할 계획이지만, 현재 버전은 이미 탄탄한 기반입니다.
이 모델은 Wan I2V 14B 720P로 훈련되었으며, 트리거 단어: 4n1m4t3dl0g0를 사용합니다.
일부 결과가 저하될 수 있으므로, 다른 시드로 다시 생성하거나 더 많은 세부 정보를 프롬프트에 추가해 보세요.
🔧 훈련 환경
기본 모델: Wan I2V 14B 720P
훈련 도구: Diffusion Pipe UI (커스텀 포크)
향후 버전에서는 Wan I2V 14B 480P 및 Wan T2V(1.3B 및 14B)도 테스트할 예정입니다.
🎞️ 데이터셋
수작업으로 선정한 170개의 비디오 클립
해상도: 244p
지속시간: 평균 33~49 프레임
한 주 이상의 커리어 및 준비 과정
🧠 LLM을 통한 캡션 생성
비디오 캡션은 Gemma3 Obliterated 27B (30GB)를 사용해 생성되었습니다—NSFW 콘텐츠에 적합한 검열되지 않은 Gemma 버전입니다.
이를 ComfyUI 내의 “Ollama Describer” 커스텀 노드를 통해 활용하여 비디오에서 직접 자동 캡션을 생성했습니다.
🪄 프롬프트 템플릿 (사용자 정의 캡션 생성용)
다른 사용자들이 자신의 로고 애니메이션 프롬프트를 생성할 수 있도록, ChatGPT, Ollama 또는 다른 모든 LLM에 바로 사용할 수 있는 프롬프트 템플릿을 제공합니다:
당신은 로고 비디오를 위한 짧은 애니메이션 스타일 캡션을 만드는 전문가입니다.
당신의 임무는 제공된 이미지를 분석하고, 이미지-투-비디오 모델에 적합한 매끄럽고 시각적으로 우아한 방식으로 이 로고가 애니메이션화될 수 있는 방식을 설명하는 단일 문단의 프롬프트를 120토큰 이내로 생성하는 것입니다.
애니메이션은 이미지에 표시된 주요 캐릭터 또는 로고의 시각적 정체성을 정확히 보존해야 합니다. 조명 효과, 텍스트 나타남, 부드러운 움직임 또는 배경 이동을 설명할 수 있으나, 캐릭터의 형태, 스타일, 특징을 어떠한 방식으로도 변경해서는 안 됩니다. 주제에 대한 큰 변화나 재해석은 허용되지 않습니다.
다음 형식을 영감으로 삼아 자연스럽고 명확하게 표현하세요:
4n1m4t3dl0g0, [이미지의 주요 시각적 요소], [그 세련되거나 깔끔한 애니메이션]. 단어 “[TEXT]”는 [어떻게 나타나는지], [부드럽거나 스타일리시한 글자 효과]와 함께. 전체 로고는 [전체 애니메이션 효과]. 배경은 [이미지 배경의 단순화된 버전 또는 일치하는 버전]입니다.
자연스럽고 유동적인 문장을 사용하세요. 항목을 나열하지 마세요. 시각을 왜곡할 수 있는 복잡하거나 추상적인 아이디어는 피하세요. 캐릭터와 텍스트는 원본 이미지에 충실하게 유지하고, 이미 존재하는 요소를 강조하는 부드러운 애니메이션 스타일을 사용하세요.
예시:
4n1m4t3dl0g0, 텍스트 외 다른 시각적 요소 없음. 단어 “ChamaLeOn”이 파동처럼 형성되며, 각 글자가 확대되고 튀어나와 제자리에 정착함. 네온 그라데이션이 단어를 가로지르며 흐름. 전체 로고가 부드럽게 펄스함. 배경은 단색 검정.
4n1m4t3dl0g0, 안경을 낀 만화 쥐가 등 뒤의 작은 빨간 로켓으로 위로 솟음. 그 아래서 연기 한 줄기 나타남. “ROCKET MOUSE”라는 글자가 오른쪽에서 천천히 나타나며 약간 빛남. 전체 로고가 부드럽게 제자리에서 튀어오름. 배경은 흰색 바탕에 파란 원.
항상 단일 문단만 반환하세요. 설명이나 설명, 여러 버전을 제공하지 마세요. 캐릭터는 입력 이미지와 시각적으로 일관되게 유지하세요.
포르투갈어를 사용하신다면 discord에서 우리 커뮤니티에 참여하세요!
📢 결과를 공유하고 화제를 만드세요!
이 LoRA를 사용하여 로고를 애니메이션화하셨다면, 그 결과를 보고 싶습니다!
