jasperai / Flux.1-dev-Controlnet-Upscaler
詳細
ファイルをダウンロード
モデル説明
これは、Jasper研究チームが開発した、低解像度画像用のFlux.1-dev ControlNetです。

使用方法
このモデルはdiffusersライブラリと直接使用できます。
import torch
from diffusers.utils import load_image
from diffusers import FluxControlNetModel
from diffusers.pipelines import FluxControlNetPipeline
# パイプラインの読み込み
controlnet = FluxControlNetModel.from_pretrained(
"jasperai/Flux.1-dev-Controlnet-Upscaler",
torch_dtype=torch.bfloat16
)
pipe = FluxControlNetPipeline.from_pretrained(
"black-forest-labs/FLUX.1-dev",
controlnet=controlnet,
torch_dtype=torch.bfloat16
)
pipe.to("cuda")
# コントロール画像の読み込み
control_image = load_image(
"https://huggingface.co/jasperai/Flux.1-dev-Controlnet-Upscaler/resolve/main/examples/input.jpg"
)
w, h = control_image.size
# 4倍にアップスケール
control_image = control_image.resize((w * 4, h * 4))
image = pipe(
prompt="",
control_image=control_image,
controlnet_conditioning_scale=0.6,
num_inference_steps=28,
guidance_scale=3.5,
height=control_image.size[1],
width=control_image.size[0]
).images[0]
image

学習
このモデルは、[1]と同様のアプローチで、リアルな画像を入力とし、ガウシアンノイズやポアソンノイズ、画像のぼかし、JPEG圧縮などの複数の劣化を組み合わせて合成された複雑なデータ劣化スキームで学習されました。
[1] Wang, Xintao, et al. "Real-esrgan: Training real-world blind super-resolution with pure synthetic data." Proceedings of the IEEE/CVF international conference on computer vision. 2021.
ライセンス
このモデルはFlux.1-devモデルライセンスの下にあります。
