Qwen Edit 2511 FP8 e4m3fn

詳細

ファイルをダウンロード

モデル説明

💜 Qwen Chat   |   🤗 Hugging Face   |   🤖 ModelScope   |    📑 Tech Report    |    📑 Blog   
🖥️ Demo   |   💬 WeChat (微信)   |   🫨 Discord  |    Github  

紹介

Qwen-Image-Edit-2511をご紹介します。これはQwen-Image-Edit-2509の強化版であり、特に一貫性が大幅に向上しています。最新モデルをお試しになりたい場合は、Qwen Chatにアクセスし、画像編集機能を選択してください。

Qwen-Image-Edit-2511の主な改善点は以下の通りです:画像のドリフトの軽減、キャラクターの一貫性の向上、LoRA機能の統合、産業デザイン生成の強化、幾何学的推論能力の強化です。

すぐに始める

最新版のdiffusersをインストールしてください

pip install git+https://github.com/huggingface/diffusers

以下はQwen-Image-Edit-2511の使用方法を示すコードスニペットです:

import os
import torch
from PIL import Image
from diffusers import QwenImageEditPlusPipeline

pipeline = QwenImageEditPlusPipeline.from_pretrained("Qwen/Qwen-Image-Edit-2511", torch_dtype=torch.bfloat16)
print("pipeline loaded")

pipeline.to('cuda')
pipeline.set_progress_bar_config(disable=None)
image1 = Image.open("input1.png")
image2 = Image.open("input2.png")
prompt = "The magician bear is on the left, the alchemist bear is on the right, facing each other in the central park square."
inputs = {
    "image": [image1, image2],
    "prompt": prompt,
    "generator": torch.manual_seed(0),
    "true_cfg_scale": 4.0,
    "negative_prompt": " ",
    "num_inference_steps": 40,
    "guidance_scale": 1.0,
    "num_images_per_prompt": 1,
}
with torch.inference_mode():
    output = pipeline(**inputs)
    output_image = output.images[0]
    output_image.save("output_image_edit_2511.png")
    print("image saved at", os.path.abspath("output_image_edit_2511.png"))

機能紹介

Qwen-Image-Edit-2511はキャラクターの一貫性を強化 Qwen-Image-Edit-2511では、キャラクターの一貫性が大幅に改善されています。モデルは入力された肖像画をもとに想像的な編集を実行しつつ、被写体のアイデンティティと視覚的特徴を維持できます。

複数人物の一貫性の向上 Qwen-Image-Edit-2509は単一被写体の編集における一貫性をすでに改善していましたが、Qwen-Image-Edit-2511は複数人物のグループ写真における一貫性をさらに強化し、2つの別々の人物画像を一貫性のあるグループ写真に高精細に融合可能にしました:

コミュニティ作成LoRAの内蔵対応 Qwen-Image-Editのリリース以来、コミュニティは多くの創造的で高品質なLoRAを開発し、その表現力の可能性を大きく広げてきました。Qwen-Image-Edit-2511は、人気の高いLoRAをいくつかベースモデルに直接統合し、追加の調整なしでその効果を活用できます。

たとえば、Lighting Enhancement LoRAにより、すぐにリアルな照明制御が可能になりました:

もう一つの例として、新しい視点の生成もベースモデルだけで直接可能になりました:

産業デザインへの応用

実用的なエンジニアリングシナリオに特に注力しました。たとえば、一括工業製品デザイン:

および工業部品の素材交換:

強化された幾何学的推論能力 Qwen-Image-Edit-2511は、より強力な幾何学的推論能力を導入しました。たとえば、デザインや注釈の目的で補助的な構築線を直接生成できます:

以上がQwen-Image-Edit-2511の主な更新内容です。新しい機能をお楽しみください!🎉

ライセンス契約

Qwen-ImageはApache 2.0ライセンスのもとで提供されています。

引用

本作が役立った場合は、ぜひ引用をお願いします。

@misc{wu2025qwenimagetechnicalreport,
      title={Qwen-Image Technical Report}, 
      author={Chenfei Wu and Jiahao Li and Jingren Zhou and Junyang Lin and Kaiyuan Gao and Kun Yan and Sheng-ming Yin and Shuai Bai and Xiao Xu and Yilei Chen and Yuxiang Chen and Zecheng Tang and Zekai Zhang and Zhengyi Wang and An Yang and Bowen Yu and Chen Cheng and Dayiheng Liu and Deqing Li and Hang Zhang and Hao Meng and Hu Wei and Jingyuan Ni and Kai Chen and Kuan Cao and Liang Peng and Lin Qu and Minggang Wu and Peng Wang and Shuting Yu and Tingkun Wen and Wensen Feng and Xiaoxiao Xu and Yi Wang and Yichang Zhang and Yongqiang Zhu and Yujia Wu and Yuxuan Cai and Zenan Liu},
      year={2025},
      eprint={2508.02324},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2508.02324}, 
}

このモデルで生成された画像

画像が見つかりません。