Qwen Edit 2511 FP8 e4m3fn

세부 정보

파일 다운로드

모델 설명

💜 Qwen Chat   |   🤗 Hugging Face   |   🤖 ModelScope   |    📑 Tech Report    |    📑 Blog   
🖥️ Demo   |   💬 WeChat (微信)   |   🫨 Discord  |    Github  

소개

Qwen-Image-Edit-2511을 소개해 드립니다. 이는 Qwen-Image-Edit-2509의 개선된 버전으로, 특히 일관성 향상 등 여러 가지 개선 사항을 포함하고 있습니다. 최신 모델을 시험해 보려면 Qwen Chat에 방문하여 이미지 편집 기능을 선택하세요.

Qwen-Image-Edit-2511의 주요 개선 사항은 다음과 같습니다: 이미지 드리프트 완화, 캐릭터 일관성 향상, LoRA 기능 통합, 산업 디자인 생성 능력 강화, 기하학적 추론 능력 강화입니다.

빠른 시작

최신 버전의 diffusers를 설치하세요.

pip install git+https://github.com/huggingface/diffusers

다음은 Qwen-Image-Edit-2511을 사용하는 방법을 보여주는 코드 스니펫입니다:

import os
import torch
from PIL import Image
from diffusers import QwenImageEditPlusPipeline

pipeline = QwenImageEditPlusPipeline.from_pretrained("Qwen/Qwen-Image-Edit-2511", torch_dtype=torch.bfloat16)
print("pipeline loaded")

pipeline.to('cuda')
pipeline.set_progress_bar_config(disable=None)
image1 = Image.open("input1.png")
image2 = Image.open("input2.png")
prompt = "The magician bear is on the left, the alchemist bear is on the right, facing each other in the central park square."
inputs = {
    "image": [image1, image2],
    "prompt": prompt,
    "generator": torch.manual_seed(0),
    "true_cfg_scale": 4.0,
    "negative_prompt": " ",
    "num_inference_steps": 40,
    "guidance_scale": 1.0,
    "num_images_per_prompt": 1,
}
with torch.inference_mode():
    output = pipeline(**inputs)
    output_image = output.images[0]
    output_image.save("output_image_edit_2511.png")
    print("image saved at", os.path.abspath("output_image_edit_2511.png"))

데모

Qwen-Image-Edit-2511은 캐릭터 일관성을 향상시킵니다. Qwen-Image-Edit-2511에서는 캐릭터 일관성이 크게 향상되었습니다. 모델은 입력된 초상화를 기반으로 상상력을 발휘하여 편집을 수행하면서도 피사체의 정체성과 시각적 특징을 유지할 수 있습니다.

다중 인물 일관성 향상 Qwen-Image-Edit-2509는 단일 피사체 편집의 일관성을 이미 향상시켰으나, Qwen-Image-Edit-2511은 다중 인물 그룹 사진의 일관성을 더욱 강화하여 두 개의 별개 인물 이미지를 일관된 그룹 사진으로 고해상도로 융합할 수 있습니다:

커뮤니티에서 제작한 LoRA에 내장 지원 Qwen-Image-Edit 출시 이후 커뮤니티는 다양한 창의적이고 고품질의 LoRA를 개발하여 표현력의 가능성을 크게 확장했습니다. Qwen-Image-Edit-2511은 선택된 인기 있는 LoRA를 기본 모델에 직접 통합하여 추가 튜닝 없이도 그 효과를 활용할 수 있도록 합니다.

예를 들어, 조명 향상 LoRA를 통해 즉시 사실적인 조명 제어가 가능합니다:

다른 예로, 기본 모델만으로도 새로운 시점을 직접 생성할 수 있습니다:

산업 디자인 적용

실용적인 공학 시나리오에 특별히 주목했습니다. 예를 들어, 일괄 산업 제품 디자인:

그리고 산업 부품의 재질 교체:

향상된 기하학적 추론 Qwen-Image-Edit-2511은 더 강력한 기하학적 추론 능력을 도입했습니다. 예를 들어, 설계 또는 주석 목적을 위한 보조 구조선을 직접 생성합니다:

이상이 Qwen-Image-Edit-2511의 주요 업데이트입니다. 새로운 기능을 탐색해 보세요! 🎉

라이선스 계약

Qwen-Image는 Apache 2.0 라이선스 하에 제공됩니다.

인용

이 작업이 유용하다고 생각하신다면, 인용해 주시면 감사하겠습니다.

@misc{wu2025qwenimagetechnicalreport,
      title={Qwen-Image Technical Report}, 
      author={Chenfei Wu and Jiahao Li and Jingren Zhou and Junyang Lin and Kaiyuan Gao and Kun Yan and Sheng-ming Yin and Shuai Bai and Xiao Xu and Yilei Chen and Yuxiang Chen and Zecheng Tang and Zekai Zhang and Zhengyi Wang and An Yang and Bowen Yu and Chen Cheng and Dayiheng Liu and Deqing Li and Hang Zhang and Hao Meng and Hu Wei and Jingyuan Ni and Kai Chen and Kuan Cao and Liang Peng and Lin Qu and Minggang Wu and Peng Wang and Shuting Yu and Tingkun Wen and Wensen Feng and Xiaoxiao Xu and Yi Wang and Yichang Zhang and Yongqiang Zhu and Yujia Wu and Yuxuan Cai and Zenan Liu},
      year={2025},
      eprint={2508.02324},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2508.02324}, 
}

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.