ChronoEdit

세부 정보

모델 설명

GGUF | Wan2.1 T2V LoRA: 호환됨 (NSFW)

현재로선 **ComfyUI**를 nightly 버전으로 변경해야 합니다. 일부 노드가 안정판에 아직 포함되어 있지 않기 때문입니다. 다음 주까지 업데이트될 수 있습니다. zip 파일 내의 워크플로우

FP16: 10GB VRAM + 64GB RAM + Diffusion Model Loader KJ + triton

이것은 이미지 편집기입니다. 시작 이미지와 텍스트 지시사항을 입력하면, 수정된 버전의 이미지를 생성합니다. 그러나 이 도구는 움직임이나 물리적 현상을 더 잘 처리하기 위해 Wan2.1과 같은 비디오 모델의 지능을 차용하며, 편집 과정을 뇌 속에서 초단기 "비디오"로 처리하여 더 현실적인 결과를 도출합니다. 이 모델은 Wan 비디오 모델과 동일한 텍스트 인코더 및 기타 구성 요소를 공유하며, 이를 기반으로 구축되었습니다.

자세한 정보 | 예시 프롬프트

  • 더 지능적인 설정: 시간 기반 편집을 위해 대형 비디오 모델을 기반으로 하며, 로봇 동작이나 물체 쥐기와 같은 물리적 행동을 시뮬레이션하는 지능을 추가하여 기본 이미지 편집기보다 현실적인 동역학을 처리합니다.

  • 흥미로운 기능: 정적 이미지를 액션 시뮬레이션으로 전환하며, 중력, 움직임 등을 일관되게 유지합니다. 1024x1024까지 정사각형 또는 가로/세로 비율의 이미지를 처리합니다.

  • 강점: 로봇 계획이나 상호작용 장면과 같은 PhysicalAI 작업에 최적화되어 있습니다. 가상 세계 데이터로 학습되었기 때문에 이 분야에서 뛰어나지만, 일상적인 사진에는 부족할 수 있습니다.

  • 간단한 팁: 이미지에 짧은 텍스트 지시사항(300단어 이하)을 함께 사용하세요. 예: "로봇이 공을 현실적으로 집어들게 해줘." NVIDIA GPU에서 실행하면 속도가 빠르며, 실제 사용 시에는 안전 검사 기능을 추가하세요.

  • 기본 사양: 140억 개 파라미터, Diffusers 형식, 상업용 오픈 라이선스. 입력: 이미지 + 텍스트, 출력: 수정된 이미지, 추가 설정 불필요.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.