Qwen-Image-Edit Lowres-Fix (Input Image Repair)

詳細

ファイルをダウンロード

モデル説明

Qwen-Image-Edit 低解像度入力修復 LoRA

モデル紹介

Qwen-Image-Edit は強力なオープンソースの画像編集モデルです。しかし、モデルの入力解像度が画像生成のターゲット解像度より低い場合、画像の詳細を維持する能力が劣ります。この問題を解決するために、以下の2つの修正を施しました:

  1. Rope補間:Qwen-Image DiTにおける入力画像の位置エンコーディングを、ターゲット解像度での位置エンコーディングの補間サンプリングに変更しました。この修正は修正2とは独立して機能します。

  2. LoRAファインチューニング:DiTによるこの補間エンコーディングの汎化性能を高めるために、LoRAモデルを迅速に学習します。

これらの2つの修正により、モデルは低解像度の入力であっても一貫した編集画像を生成できるようになります。さらに、高解像度入力と比較して、モデルの推論時間は大幅に短縮されます。

ソース:https://modelscope.cn/models/DiffSynth-Studio/Qwen-Image-Edit-Lowres-Fix

このモデルで生成された画像

画像が見つかりません。