王炸！微软发布Visual ChatGPT：视觉模型加持ChatGPT实现丝滑聊天-工信会

> 自媒体 > （AI）人工智能 > 王炸！微软发布Visual ChatGPT：视觉模型加持ChatGPT实现丝滑聊天

王炸！微软发布Visual ChatGPT：视觉模型加持ChatGPT实现丝滑聊天

来源：大数据文摘

2023-08-08 16:40:17

656

管理

大数据文摘授权转载自夕小瑶的卖萌屋

作者：炼丹学徒

近来，AI领域迎来各个领域的大突破，ChatGPT展现出强大的语言问答能力和推理能力，然而作为一个自然语言模型，它无法处理视觉信息。

与此同时，视觉基础模型如Visual Transformer或者Stable Diffusion等，则展现出强大的视觉理解和生成能力。

Visual Transformer将ChatGPT作为逻辑处理中心，集成若干视觉基础模型，从而达到如下效果：

视觉聊天系统Visual ChatGPT可以接收和发送文本和图像

提供复杂的视觉问答，或者视觉编辑指令，可以通过多步推理调用工具来解决复杂视觉任务

可以提供反馈，总结答案，主动询问模糊的指令等

这个工作开启了ChatGPT借助视觉基础模型作为工具，进行视觉任务处理的研究方向。

论文链接：

https://arxiv.org/abs/2303.04671

开源代码：

https://github.com/microsoft/visual-chatgpt

论文作者：

Chenfei Wu, Shengming Yin, Weizhen Qi, Xiaodong Wang, Zecheng Tang, Nan Duan

机构：微软亚洲研究院

模型效果

工作流程

对于用户输入，添加于全局原则prompt，工具描述prompt，历史会话prompt之后，送给ChatGPT进行逻辑推理（Use VFM?）得到推理结果（就是这一次得到的GPT文本输出）。经过正则匹配进行分析，如果工具调用结束，则直接提取总结输出作为最终回复，如果是需要继续调用工具，则将提取到的工具名称、工作参数，输入视觉基础模型，从而得到，置于思考历史中，进行下一轮推理。或者说喂给GPT的内容为：

第一次问答里，第一个API：

第一次问答里，第二个API:

第一次问答里，第三个API:

第二次问答里，第一个API:

第二次问答里，第二个API:

得到GPT的输出后，正则匹配进行工具的判断和解析，最终决定流程。API调用历史在每次回答后清空，其中只有最后总结性的回复被记录进入对话历史

细节描述

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

微信号无法登录如何查看及导出微信聊天记录

2023-08-08 16:42

官方通报“四川一公职人员被曝涉不雅聊天”，此前爆料者已发道歉信

2023-08-08 16:37

相关文章

国产车也能卖上百万，这4款称得上真正的“国产之光”！..

随着时代的变化，中国品牌车型的出口量迅猛增长，仅2022年的出口量就达到..

一周图说：上海车展前，关于国产车你要知道这些

上海车展即将在下周（4月20-29日）开幕。中国作为全球最大和发展最快的汽..

试完2026款卡罗拉\u0026锐放，我直接退了国产车的订单

说实话，我一开始是冲着国产车去的。15万预算，配置表翻烂了，什么大屏、..

别乱选！质量可靠的十大国产车：红旗奇瑞被认可，吉利哈弗入围！..

近两年，国产车品牌通过加速布局新能源汽车市场，实现了销量方面的“弯道..

盘点国产质量巅峰的6款车，过年回家在这里选，省心10年开不坏..

之前人们对于国产车没有太高的认可度，认为国产车质量并不出色，可是如今..

2023上半年销量最好的50款SUV揭晓，国产车几乎霸...

2023年1-6月SUV全国合计445.4万辆。数据来源：乘联会。·丰田卡罗拉锐放-..

1月豪车排名：商务人士依旧不认可国产车

1月这张中大型轿车榜单，看着像“油车反扑”，其实更像一面照妖镜：谁在..

油耗低，空间大，续航长，家用一流，盘点5款20w级高品质国产车..

纵观2024年国内车市，“内卷”一词能贯穿全年。各家车企之间的价格战也是..

国产车尴尬了？国外机构评测：没有实体按键的汽车，安全性差一些..

如果大家有关注现在的汽车风向标，特别是新能源汽车，就会发现一个很明显..

关于作者

大男孩(普通会员)

文章

1969

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

DeepSeek 究竟是个啥？一文带你看明白

2025/02/08

02

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

03

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

04

这怕是全网最强的 DeepSeek 图片教程吧，赶紧收藏了！

2025/02/09

05

AI 界黑马DeepSeek 超详细介绍

2025/02/09

标签云

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体104736

@2022 All Rights Reserved

浙ICP备19035174号-6 技术支持：千寻网络

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索