AuraFlow VAE

세부 정보

파일 다운로드

모델 설명

AuraFlow v0.1은 완전히 오픈소스된 플로우 기반 텍스트-이미지 생성 모델입니다.

AuraFlow v0.2는 완전히 오픈소스된 플로우 기반 텍스트-이미지 생성 모델입니다. 이 모델은 이전 버전보다 더 많은 컴퓨팅 자원으로 학습되었습니다.

AuraFlow v0.3는 완전히 오픈소스된 플로우 기반 텍스트-이미지 생성 모델입니다. 이 모델은 이전 버전보다 더 많은 컴퓨팅 자원으로 학습되었습니다.

이 모델은 GenEval에서 최신 결과를 달성했습니다. 더 많은 기술적 세부 정보는 우리의 블로그 포스트를 참고하세요. 또한 이 갤러리 페이지에서 다른 모델들과의 비교를 확인할 수 있습니다.

현재 이 모델은 베타 단계입니다. 우리는 모델을 개선하고 있으며, 커뮤니티의 피드백이 중요합니다. 모델 개발 동향을 확인하고 피드백을 주려면 fal의 Discord에 참여하세요.

감사 인사: 이 프로젝트를 실현해준 @cloneofsimo@isidentical에게 큰 감사의 말을 전합니다. 두 명의 뛰어난 엔지니어가 이렇게 짧은 시간 안에 이 정도의 성과를 이뤄낸 것은 정말 놀라운 일입니다. 또한 우리의 연구 기반을 마련해준 뛰어난 연구자들에게도 감사의 마음을 전합니다.

사용법 (v0.1)

$ pip install transformers accelerate protobuf sentencepiece
$ pip install git+https://github.com/huggingface/diffusers.git

from diffusers import AuraFlowPipeline
import torch

pipeline = AuraFlowPipeline.from_pretrained(
    "fal/AuraFlow",
    torch_dtype=torch.float16
).to("cuda")

image = pipeline(
    prompt="close-up portrait of a majestic iguana with vibrant blue-green scales, piercing amber eyes, and orange spiky crest. Intricate textures and details visible on scaly skin. Wrapped in dark hood, giving regal appearance. Dramatic lighting against black background. Hyper-realistic, high-resolution image showcasing the reptile's expressive features and coloration.",
    height=1024,
    width=1024,
    num_inference_steps=50, 
    generator=torch.Generator().manual_seed(666),
    guidance_scale=3.5,
).images[0]

사용법 (v0.2)

$ pip install transformers accelerate protobuf sentencepiece
$ pip install git+https://github.com/huggingface/diffusers.git
from diffusers import AuraFlowPipeline
import torch

pipeline = AuraFlowPipeline.from_pretrained(
    "fal/AuraFlow-v0.2",
    torch_dtype=torch.float16,
    variant="fp16",
).to("cuda")

image = pipeline(
    prompt="close-up portrait of a majestic iguana with vibrant blue-green scales, piercing amber eyes, and orange spiky crest. Intricate textures and details visible on scaly skin. Wrapped in dark hood, giving regal appearance. Dramatic lighting against black background. Hyper-realistic, high-resolution image showcasing the reptile's expressive features and coloration.",
    height=1024,
    width=1024,
    num_inference_steps=50, 
    generator=torch.Generator().manual_seed(666),
    guidance_scale=3.5,
).images[0]

image.save("output.png")

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.