jasperai / Flux.1-dev-Controlnet-Upscaler

詳細

ファイルをダウンロード

モデル説明

これは、Jasper研究チームが開発した、低解像度画像用のFlux.1-dev ControlNetです。

使用方法

このモデルはdiffusersライブラリと直接使用できます。

import torch
from diffusers.utils import load_image
from diffusers import FluxControlNetModel
from diffusers.pipelines import FluxControlNetPipeline

# パイプラインの読み込み
controlnet = FluxControlNetModel.from_pretrained(
  "jasperai/Flux.1-dev-Controlnet-Upscaler",
  torch_dtype=torch.bfloat16
)
pipe = FluxControlNetPipeline.from_pretrained(
  "black-forest-labs/FLUX.1-dev",
  controlnet=controlnet,
  torch_dtype=torch.bfloat16
)
pipe.to("cuda")

# コントロール画像の読み込み
control_image = load_image(
  "https://huggingface.co/jasperai/Flux.1-dev-Controlnet-Upscaler/resolve/main/examples/input.jpg"
)

w, h = control_image.size

# 4倍にアップスケール
control_image = control_image.resize((w * 4, h * 4))

image = pipe(
    prompt="", 
    control_image=control_image,
    controlnet_conditioning_scale=0.6,
    num_inference_steps=28, 
    guidance_scale=3.5,
    height=control_image.size[1],
    width=control_image.size[0]
).images[0]
image

学習

このモデルは、[1]と同様のアプローチで、リアルな画像を入力とし、ガウシアンノイズやポアソンノイズ、画像のぼかし、JPEG圧縮などの複数の劣化を組み合わせて合成された複雑なデータ劣化スキームで学習されました。

[1] Wang, Xintao, et al. "Real-esrgan: Training real-world blind super-resolution with pure synthetic data." Proceedings of the IEEE/CVF international conference on computer vision. 2021.

ライセンス

このモデルはFlux.1-devモデルライセンスの下にあります。

このモデルで生成された画像

画像が見つかりません。