AuraFlow VAE
세부 정보
파일 다운로드
모델 설명
AuraFlow v0.1은 완전히 오픈소스된 플로우 기반 텍스트-이미지 생성 모델입니다.
AuraFlow v0.2는 완전히 오픈소스된 플로우 기반 텍스트-이미지 생성 모델입니다. 이 모델은 이전 버전보다 더 많은 컴퓨팅 자원으로 학습되었습니다.
AuraFlow v0.3는 완전히 오픈소스된 플로우 기반 텍스트-이미지 생성 모델입니다. 이 모델은 이전 버전보다 더 많은 컴퓨팅 자원으로 학습되었습니다.
이 모델은 GenEval에서 최신 결과를 달성했습니다. 더 많은 기술적 세부 정보는 우리의 블로그 포스트를 참고하세요. 또한 이 갤러리 페이지에서 다른 모델들과의 비교를 확인할 수 있습니다.
현재 이 모델은 베타 단계입니다. 우리는 모델을 개선하고 있으며, 커뮤니티의 피드백이 중요합니다. 모델 개발 동향을 확인하고 피드백을 주려면 fal의 Discord에 참여하세요.
감사 인사: 이 프로젝트를 실현해준 @cloneofsimo와 @isidentical에게 큰 감사의 말을 전합니다. 두 명의 뛰어난 엔지니어가 이렇게 짧은 시간 안에 이 정도의 성과를 이뤄낸 것은 정말 놀라운 일입니다. 또한 우리의 연구 기반을 마련해준 뛰어난 연구자들에게도 감사의 마음을 전합니다.
사용법 (v0.1)
$ pip install transformers accelerate protobuf sentencepiece
$ pip install git+https://github.com/huggingface/diffusers.git
from diffusers import AuraFlowPipeline
import torch
pipeline = AuraFlowPipeline.from_pretrained(
"fal/AuraFlow",
torch_dtype=torch.float16
).to("cuda")
image = pipeline(
prompt="close-up portrait of a majestic iguana with vibrant blue-green scales, piercing amber eyes, and orange spiky crest. Intricate textures and details visible on scaly skin. Wrapped in dark hood, giving regal appearance. Dramatic lighting against black background. Hyper-realistic, high-resolution image showcasing the reptile's expressive features and coloration.",
height=1024,
width=1024,
num_inference_steps=50,
generator=torch.Generator().manual_seed(666),
guidance_scale=3.5,
).images[0]
사용법 (v0.2)
$ pip install transformers accelerate protobuf sentencepiece
$ pip install git+https://github.com/huggingface/diffusers.git
from diffusers import AuraFlowPipeline
import torch
pipeline = AuraFlowPipeline.from_pretrained(
"fal/AuraFlow-v0.2",
torch_dtype=torch.float16,
variant="fp16",
).to("cuda")
image = pipeline(
prompt="close-up portrait of a majestic iguana with vibrant blue-green scales, piercing amber eyes, and orange spiky crest. Intricate textures and details visible on scaly skin. Wrapped in dark hood, giving regal appearance. Dramatic lighting against black background. Hyper-realistic, high-resolution image showcasing the reptile's expressive features and coloration.",
height=1024,
width=1024,
num_inference_steps=50,
generator=torch.Generator().manual_seed(666),
guidance_scale=3.5,
).images[0]
image.save("output.png")

