henry 发自 凹非寺
量子位 | 公众号 QbitAI
用提示词就能点对点编辑图片?
Qwen:没错,正是在下。
一次出图,玩转增删改话不多说,我们直接看效果。
原创IP编辑原创IP编辑需要保持原始图像视觉语义不变的前提下,对图像内容进行修改,也就是所谓的语义编辑。
Qwen以他们的吉祥物卡皮巴拉作为输入,生成了一系列衍生IP形象。

(卡皮巴拉:我一好好的水豚成熊了?)
不难看出,这些IP形象既忠实呈现了卡皮巴拉的角色特性,又在对应场景中展现出丰富多彩的形象。
那么,Demo很优秀,实测效果又如何?
对此,我们进行了简单地实测,提示词:这只熊穿着体操队服,双手拉在单杠上。

实话说,生成效果确实不赖,单杠因受力产生了自然变形,更难能可贵的是双手手指数量也是一致的(动漫角色经典的四根手指)。
视角转换接下来是视角转换,Qwen-Image-Edit在这里不仅展示了90度旋转,还展示了180度旋转。

(眼镜框细节倒是保留了下来)
不过,在网友的测试中,效果倒是非常不错:自拍头像的女性版本,动漫版,007版和恶魔版本。

我们用一张在颐和园实拍的照片进行测试,提示词:add the small wooden sign in the foreground in front of the tree with the text ‘welcome to SummerPalace’(在树前的前景中添加一个小木牌,牌上写着“欢迎来到颐和园”。)

同时,由于照片的分辨率较高,生成的图片有些失真。
不过,基本的画面元素和新增操作还是实现了。
为了验证是否是分辨率的问题,我们把照片换成分辨率没那么高的漫画图片,输出效果还是非常不错的。
提示词:add the small wooden sign in the foreground in front of the woman with the text ‘welcome to the sea’(在女人前的前景中添加一个小木牌,牌上写着“欢迎来到大海”。)

不难看出,这幅AI生成的书法作品中有不少错字。
在这里,Qwen展示了不用重新生成整幅图片,就能解决这些问题的办法——
很简单,就是框住错误的字,交给Qwen-Image-Edit改就可以。

离谱的是,对于一些生僻字,还可以圈出错误的偏旁,实现偏旁级别的修复。
就这样,逐步修改画面中的瑕疵,最终得到完美的图片。
需要说明的是,上述简单实测均为一次出图。
可以看到,经过Qwen-Image-Edit处理的图片,虽然有时会有一些色调,细节的轻微改变,但在绝大多数情况下,都和官方说的一样,能达到不错的编辑效果。
你给这个效果打几分?
创意 精准,统统搞定据介绍,Qwen-Image-Edit这次的主要更新包括:
语义与外观双重编辑:Qwen-Image-Edit不仅支持low-level的视觉外观编辑(如元素的添加、删除、修改等,要求图片其他区域完全不变),也支持high-level的视觉语义编辑(如IP创作、物体旋转、风格迁移等,允许整体像素变化但保持语义一致)。精准文字编辑:Qwen-Image-Edit支持中英文双语文字编辑,可在保留原有字体、字号、风格的前提下,直接对图片中的文字进行增、删、改等操作。强大的基准性能:在多个公开基准测试中的评估表明,Qwen-Image-Edit在图像编辑任务上具备SOTA性能,是一个强大的图像编辑基础模型。其中,为了同时实现语义与外观双重的编辑能力,Qwen-Image-Edit将输⼊图像同时输⼊到Qwen2.5-VL(实现视觉语义控制)和VAEEncoder(实现视觉外观控制)。
换句话说,就是从创意裂变到精准改字,所有常见的图像编辑需求Qwen都能hold住。
最后,Qwen-Image-Edit的体验方式如下,感兴趣的同学快去体验吧!
Qwen-Image-Edit:https://huggingface.co/spaces/Qwen/Qwen-Image-Edit
Qwenchat:https://chat.qwen.ai/
GitHub:https://github.com/QwenLM/Qwen-Image
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
相关文章




猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体113339