AuraFlow VAE

詳細

ファイルをダウンロード

モデル説明

AuraFlow v0.1は、完全にオープンソース化されたフローベースのテキストから画像生成モデルです。

AuraFlow v0.2は、完全にオープンソース化されたフローベースのテキストから画像生成モデルです。本モデルは、以前のバージョンよりもより多くの計算リソースで学習されました。

AuraFlow v0.3は、完全にオープンソース化されたフローベースのテキストから画像生成モデルです。本モデルは、以前のバージョンよりもより多くの計算リソースで学習されました。

このモデルはGenEvalで最先端の結果を達成しています。詳細な技術情報については、我们的ブログ記事をご覧ください。他のモデルとの比較は、このギャラリーページで確認できます。

現在、このモデルはベータ版です。改善を進めていますので、コミュニティからのフィードバックが重要です。falのDiscordに参加して、フィードバックを提供し、モデル開発の進行状況をご覧ください。

クレジット:このプロジェクトを実現してくださった@cloneofsimo@isidenticalに心より感謝します。2人の優れたエンジニアがこれほどの短期間でこのような成果を上げられるのは驚異的です。また、私たちの取り組みの基盤を築いてくれた素晴らしい研究者たちにも感謝します。

使用方法(v0.1)

$ pip install transformers accelerate protobuf sentencepiece
$ pip install git+https://github.com/huggingface/diffusers.git

from diffusers import AuraFlowPipeline
import torch

pipeline = AuraFlowPipeline.from_pretrained(
    "fal/AuraFlow",
    torch_dtype=torch.float16
).to("cuda")

image = pipeline(
    prompt="close-up portrait of a majestic iguana with vibrant blue-green scales, piercing amber eyes, and orange spiky crest. Intricate textures and details visible on scaly skin. Wrapped in dark hood, giving regal appearance. Dramatic lighting against black background. Hyper-realistic, high-resolution image showcasing the reptile's expressive features and coloration.",
    height=1024,
    width=1024,
    num_inference_steps=50, 
    generator=torch.Generator().manual_seed(666),
    guidance_scale=3.5,
).images[0]

使用方法(v0.2)

$ pip install transformers accelerate protobuf sentencepiece
$ pip install git+https://github.com/huggingface/diffusers.git
from diffusers import AuraFlowPipeline
import torch

pipeline = AuraFlowPipeline.from_pretrained(
    "fal/AuraFlow-v0.2",
    torch_dtype=torch.float16,
    variant="fp16",
).to("cuda")

image = pipeline(
    prompt="close-up portrait of a majestic iguana with vibrant blue-green scales, piercing amber eyes, and orange spiky crest. Intricate textures and details visible on scaly skin. Wrapped in dark hood, giving regal appearance. Dramatic lighting against black background. Hyper-realistic, high-resolution image showcasing the reptile's expressive features and coloration.",
    height=1024,
    width=1024,
    num_inference_steps=50, 
    generator=torch.Generator().manual_seed(666),
    guidance_scale=3.5,
).images[0]

image.save("output.png")

このモデルで生成された画像

画像が見つかりません。