GPT-3、Stable Diffusion一起助攻，让模型听懂甲方修图需求-工信会

> 自媒体 > （AI）人工智能 > GPT-3、Stable Diffusion一起助攻，让模型听懂甲方修图需求

GPT-3、Stable Diffusion一起助攻，让模型听懂甲方修图需求

来源：数据派THU

2023-05-01 22:21:03

533

管理

本文约2000字，建议阅读5分钟

GPT-3、Stable Diffusion 一起助攻，让模型秒变 PS 高手，改图随心所欲。

AI 可以完全按照甲方意愿修图？GPT-3、Stable Diffusion 一起助攻，让模型秒变 PS 高手，改图随心所欲。

扩散模型大火之后，很多人将注意力放到了如何利用更有效的 prompt 生成自己想要的图像。在对于一些 AI 作画模型的不断尝试中，人们甚至总结出了让 AI 好好出图的关键词经验：

的变分自编码器的潜空间中操作来提高扩散模型的效率和质量。

对于一个图像 x，扩散过程向编码的 latent

中添加噪声，它产生一个有噪声的 latent z_t，其中噪声水平随时间步 t∈T 而增加。研究者学习一个网络

此前，曾有研究（Wang et al.）表明，对于图像翻译（image translation）任务，尤其是在成对训练数据有限的情况下，微调大型图像扩散模型优于从头训练。因此在新研究中，作者使用预训练的 Stable Diffusion checkpoint 初始化模型的权重，利用其强大的文本到图像生成能力。

为了支持图像调节，研究人员向第一个卷积层添加额外的输入通道，连接 z_t 和

。扩散模型的所有可用权重都从预训练的 checkpoint 初始化，同时在新添加的输入通道上运行的权重被初始化为零。作者在这里重用最初用于 caption 的相同的文本调节机制，而没有将文本编辑指令 c_T 作为输入。

实验结果

在下面这些图中，作者展示了他们新模型的图像编辑结果。这些结果针对一组不同的真实照片和艺术品。新模型成功地执行了许多具有挑战性的编辑，包括替换对象、改变季节和天气、替换背景、修改材料属性、转换艺术媒介等等。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

从硅谷到浦东，看人工智能ChatGPT利弊

2023-05-01 22:21

宣布推出对标ChatGPT的“天工”3.5！昆仑万维的现金够烧吗？

2023-05-01 22:19