> 自媒体 > (AI)人工智能 > GPT-4其实是“数学不太好的文科生”,交大教授指出开发难点
GPT-4其实是“数学不太好的文科生”,交大教授指出开发难点
来源:上观新闻
2023-04-27 15:09:03
525
管理

北京时间今天凌晨,OpenAI公司发布了GPT-4,引发全球关注。与ChatGPT不同,这是一个多模态大模型,除了能处理并输出文本,还能处理图像并给出文本分析。在文章生成、问题回答、代码编写等方面,GPT-4的能力也比ChatGPT更强。由于在GRE数学和语文考试中取得高分,有专家称“GPT-4能考上斯坦福大学”。

业内人士如何看待这个多模态预训练大语言模型?解放日报·上观新闻记者采访了上海交通大学教授、自然语言处理专家赵海。

“读图编程”表演令人惊艳

赵海教授解释,模态对应的是人类感知类型,包括文本、图像、声音等。一个智能系统如果能处理两种或两种以上的感知信息,就属于多模态。一些网络媒体对GPT-4有误解,以为它能根据用户输入的文字生成图片,其实它没有这个功能。GPT-4比ChatGPT多出的功能,是用户可以输入图片,它能“读图”并输出文字。

这方面,OpenAI给出的一个案例是:输入一张有4种食材的照片,并问GPT-4:“我们能用这些食材做什么?”它马上会罗列多种菜肴和点心。用户还可以继续问它:怎么做其中的几种菜肴和点心?这就是ChatGPT也能回答的问题了。

GPT-4根据上图给出了多种食品名称。

在执行编程任务上,这个多模态大模型也能“读图”。OpenAI的产品发布会上,研发人员演示了GPT-4能识别他手绘的一张网页草图,并根据草图写出网页的前端代码。虽然这个网页很简单,但它的“读图编程”还是令人惊艳,显示出较高的图片理解和编程能力。不过遗憾的是,这家美国企业表示,这项功能目前不对公众开放。

GPT-4 根据网页草图给出了前端代码。

谈及这种多模态功能,赵海直言:“GPT-4的产品形态会让公众感到惊艳,但对一些业内人士来说,可能就没那么惊讶了。”在他看来,GPT-4强大功能的核心与ChatGPT一样,也是参数量高达1750亿的预训练大语言模型。至于图像分析能力,可看作给大语言模型“打补丁”、拼接图像向量的结果。

“从理论上说,给大语言模型拼接图像向量是不难的,但工程实现的难度很大。”赵海分析,“因为GPT-3模型已有千亿级参数,在此基础上增加大量图像参数,算力上的压力会非常大。”

这与达观数据首席执行官陈运文博士的观点颇为吻合。作为上海最大的自然语言模型研发企业创始人,陈运文认为,在大语言模型的工程基础领域,国内科技界还需要突破一个难关——如何将成千上万张GPU卡串联在一起,让它们充分发挥算力作用。这是“BAT”目前也没有完全解决的问题。

数学解题能力靠“打补丁”

除了功能增加,GPT-4的文本处理和生成能力也优于ChatGPT。比如,在GRE、统一律师考试等多个考试中,GPT-4的得分较ChatGPT显著提高,超过大部分人类考生。特别是在GRE数学考试中,GPT-4得了163分(满分为170分),超过80%的考生,让网民直呼“智商好高”。

谈及这个大模型的数学水平,赵海笑道:“很多人没考过GRE,其实GRE的数学题难度和中国小学数学题差不多。GPT-4的数学水平不会很高,很多小学奥数题可能就解不出来。”

GPT-4为何是“数学不太好的文科生”?他解释说,和图像分析能力一样,它的数学解题能力也是通过在大模型上“打补丁”才获得的。如果只接受过互联网上的文本大数据训练,GPT-4和ChatGPT只能做出简单的算术题。要让它解出难度高一点的代数和几何题,研发团队必须为大模型加入数学领域的解题算法。

“OpenAI说GPT-4有强大的推理能力,我感觉主要指的是它的数学水平高。”赵海告诉记者,“其实,推理能力包含逻辑推理能力和数学抽象思维能力,这两种能力是有区别的,前者侧重寻找因果关系。相对而言,GPT-4的逻辑推理能力更强。”

OpenAI官网发布GPT-4。

从OpenAI的GPT系列(GPT-1、2、3,ChatGPT和GPT-4)开发思路来看,这家美国企业在向着通用人工智能商用目标迈进。与ChatGPT相比,GPT-4离商用产品又进了一步。这种进步包括:在应对政治敏感、违反伦理或法律的指令和问题时,GPT-4表现得越发成熟和安全。一些体验过GPT-4的用户还反映,输入同样的问题,GPT-4的回答常常优于ChatGPT,表现为信息量更大,“车轱辘话”更少。

未来,GPT产品可能会成为一个类似电脑操作系统的平台,让通用人工智能进入千家万户,帮助人们生成各类文章、分析和生成各种风格的图片、编写代码、回答问题……赵海指出,这种革命性产品的基础是预训练大语言模型,国内科技界和产业界的当务之急,是开发出高质量的大模型,在此基础上发展产业生态就会有很大潜力。“真正的问题不是我们能否做出来,而是能做得有多好。”

栏目主编:黄海华 题图来源:IC photo 图片编辑:项建英

来源:作者:俞陶然

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
OpenAI 在抢一个比 ChatGPT 更大的入口
当一通教育咨询电话让你分不清是真人还是AI,GPT-Realtime-2正在悄然改变..
美国佛州枪击案律师:ChatGPT为枪手作案“出谋划策”
美国佛罗里达州立大学枪击案受害者家属10日向法院提起诉讼,指控美国开放..
ChatGPT 免费额度和白嫖秘籍:不花钱也能用的硬核指南..
不知道各位昨晚有没有跟我一样,在深夜 debug 的时候突然感慨:现在的 AI..
OpenAI宣布将Codex模型引入ChatGPT在iOS和Android平台上的移动应用..
OpenAI 宣布将其 Codex 模型正式引入 ChatGPT 在 iOS 和 Android 平台上..
菲尔兹奖得主实测 ChatGPT 5.5 Pro:17 分钟出论文级成果,为学生拉响警报..
5月12日消息,菲尔兹奖得主公开分享了对 ChatGPT 5.5 Pro的实际测试体验..
OpenAI称ChatGPT周活跃用户逾9亿,Codex用户数超400
新榜讯 OpenAI首席财务官Sarah Friar透露,ChatGPT周活跃用户量突破9亿大..
ChatGPT被指为佛州枪击案“帮凶” 受害者家属提起诉讼..
美国佛罗里达州立大学枪击案受害者家属10日向法院提起诉讼,指控美国开放..
ChatGPT被指为佛州枪击案“帮凶” 受害者家属提起诉讼..
美国佛罗里达州立大学枪击案受害者家属10日向法院提起诉讼,指控美国开放..
美国枪击事件受害者家属起诉ChatGPT 称其是“帮凶”
美国佛罗里达州立大学枪击案受害者家属10日向法院提起诉讼,指控美国开放..
关于作者
杨子(普通会员)
文章
2112
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体109953

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索