Shuttle 3.1 Aesthetic

세부 정보

파일 다운로드

모델 설명

Shuttle 3.1 아스테틱

최신 업데이트, 뉴스 등을 확인하려면 우리의 [Discord](https://discord.gg/shuttleai)에 참여하세요.

모델 변형

이 모델 변형은 다양한 하드웨어 성능과 사용 사례에 최적화된 정밀도 및 형식을 제공합니다.

- [bfloat16](https://huggingface.co/shuttleai/shuttle-3.1-aesthetic/resolve/main/shuttle-3.1-aesthetic.safetensors)

- [fp8](https://huggingface.co/shuttleai/shuttle-3.1-aesthetic/resolve/main/fp8/shuttle-3.1-aesthetic-fp8.safetensors)

- GGUF (곧 제공)

Shuttle 3.1 아스테틱은 텍스트 프롬프트를 기반으로 단 4~6단계만으로 세부적이고 아름다운 이미지를 생성하도록 설계된 텍스트-투-이미지 AI 모델입니다. 이 모델은 이미지 품질, 타이포그래피, 복잡한 프롬프트 이해 및 자원 효율성에서 향상된 성능을 제공합니다.

![image/png](https://huggingface.co/shuttleai/shuttle-3.1-aesthetic/resolve/main/demo.png)

이 모델은 https://designer.shuttleai.com/ 웹사이트를 통해 시험해볼 수 있습니다.

API를 통한 모델 사용

Shuttle 3.1 아스테틱은 ShuttleAI를 통해 API로 사용할 수 있습니다.

- [ShuttleAI](https://shuttleai.com/)

- [ShuttleAI 문서](https://docs.shuttleai.com/)

🧨 Diffusers를 통한 모델 사용

diffusers 설치 또는 업그레이드:

```shell

pip install -U diffusers

```

그 후 DiffusionPipeline을 사용하여 모델을 실행할 수 있습니다:

```python

import torch

from diffusers import DiffusionPipeline

# bfloat16 텐서 형식을 사용하여 사전 학습된 모델에서 확산 파이프라인을 로드합니다.

pipe = DiffusionPipeline.from_pretrained(

"shuttleai/shuttle-3.1-aesthetic", torch_dtype=torch.bfloat16

).to("cuda")

# 필요시 모델을 CPU로 오프로드하여 VRAM을 절약하려면 다음 줄의 주석을 해제하세요.

# pipe.enable_model_cpu_offload()

# 호환되는 GPU에서 성능 향상을 위해 torch.compile을 활성화하려면 아래 줄의 주석을 해제하세요.

# 참고: 이는 로딩 시간을 크게 증가시킬 수 있습니다.

# pipe.transformer.to(memory_format=torch.channels_last)

# pipe.transformer = torch.compile(

# pipe.transformer, mode="max-autotune", fullgraph=True

# )

# 이미지 생성을 위한 프롬프트를 설정하세요.

prompt = "A cat holding a sign that says hello world"

# 확산 파이프라인을 사용하여 이미지를 생성합니다.

image = pipe(

prompt,

height=1024,

width=1024,

guidance_scale=3.5,

num_inference_steps=4,

max_sequence_length=256,

# 재현 가능한 결과를 위해 수동 시드를 사용하려면 다음 줄의 주석을 해제하세요.

# generator=torch.Generator("cpu").manual_seed(0)

).images[0]

# 생성된 이미지를 저장합니다.

image.save("shuttle.png")

```

자세한 내용은 [diffusers](https://huggingface.co/docs/diffusers/main/en/api/pipelines/flux) 문서를 확인하세요.

ComfyUI를 통한 모델 사용

[ComfyUI](https://github.com/comfyanonymous/ComfyUI)를 사용하여 Shuttle 3.1 아스테틱으로 로컬 추론을 실행하려면 이 [safetensors 파일](https://huggingface.co/shuttleai/shuttle-3.1-aesthetic/blob/main/shuttle-3.1-aesthetic.safetensors)를 사용하세요.

학습 세부 정보

Shuttle 3.1 아스테틱은 Shuttle 3 Diffusion을 기본으로 사용합니다. 이 모델은 단 4단계만으로 Flux Dev와 유사한 이미지를 생성할 수 있으며, 라이선스는 Apache 2입니다. 학습 과정에서 부분적으로 디스틸레이션을 해제했습니다. 우리는 특별한 학습 방법을 도입하여 Schnell 시리즈 모델의 한계를 극복하고, 세부 정보와 색상 표현력을 향상시켰습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.