Cosmos Base 2B T2IMG

세부 정보

파일 다운로드

모델 설명

이것은 ComfyUI와 정상적으로 작동하는 기본 체크포인트입니다. 충돌을 방지하기 위해 --fp8_e5m2-unet --fp8_e5m2-text-enc를 설정하는 것이 권장됩니다.

SDXL보다 느릴 수 있으며, 아마도 새로 개발된 모델이기 때문에 코드가 최적화되지 않았기 때문일 수 있지만, 성능은 훨씬 뛰어납니다. 512픽셀에서 2048픽셀까지, 그리고 다양한 극단적인 비율에서 작동합니다.

CFG: 2~10 사이

스탭: 15~60 사이

저는 이 모델의 원래 제작자가 아니며, 아티스트들이 사용하기 편리하도록 단일 파일로 컴파일한 것입니다.

이 모델은 모든 기준에서 탁월하며, 해부학에 매우 뛰어나고 안전하며 구성력이 탁월합니다.

Cosmos는 네 가지 모델을 포함합니다: 텍스트 설명에서 고품질 이미지를 생성하기 위한 Cosmos-Predict2-2B-Text2ImageCosmos-Predict2-14B-Text2Image, 이미지 또는 비디오 입력에서 시각 시뮬레이션을 생성하기 위한 Cosmos-Predict2-2B-Video2World 및 _Cosmos-Predict2-14B-Video2World_입니다. 물리적 AI를 위한 월드 모델 개발을 가속화하기 위해, 우리는 코드, 모델 가중치, 그리고 벤치마크(PBench)를 NVIDIA 오픈 모델 라이선스 하에 제공합니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.