> 自媒体 > (AI)人工智能 > 2023 AI现状报告:GPT-4仍最强,监管方向缺乏全球共识
2023 AI现状报告:GPT-4仍最强,监管方向缺乏全球共识
来源:澎湃新闻
2023-11-17 12:54:47
439
管理

·人工智能安全在2023年首次占据舞台中心。但人工智能界内部存在深刻分歧,世界各国政府采取的做法相互矛盾。挑战性在于,许多正在讨论的全球治理模式都需要目前陷入芯片战争的长期地缘政治对手进行合作。

OpenAI的GPT-4在经典基准测试和旨在评估人类的考试上都击败了所有其他大型语言模型。

10月12日发布的《2023年人工智能现状报告》(State of AI Report 2023)指出,OpenAI的GPT-4仍然是全球最强大的大型语言模型,生成式AI推动了生命科学的进步,并拯救了风险投资界。大型科技公司因计算基础设施和庞大的资本储备主导了AI行业,而开源社区继续蓬勃发展。

报告称,尽管AI的安全问题迅速提上全球议程,但今年各国政府在监管人工智能方面“缺乏具体进展”。报告对未来一年的趋势作出了预测。

《人工智能现状报告》已连续六年发布,成为AI行业流行的风向标。今年,该报告由Air Street Capital公司的投资者内森·贝纳什(Nathan Benaich)编制。前几年,现任英国政府人工智能安全工作组领导者的投资人伊恩·霍加斯(Ian Hogarth)是报告的合著者。

AI初创公司募资超过180亿美元

“今年是编写这份报告最激动人心的年份之一,我们相信它会对每个人有所帮助——从人工智能研究到政治。”作者在发布该报告的新闻稿中写道,“去年的大部分时间里,大型语言模型(LLM)似乎是唯一的‘游戏’。虽然《人工智能现状报告》预测transformers(谷歌开发的一种深度学习模型,OpenAI在此基础上开发了GPT)将在2021年作为通用系统出现,但功能的重大进步让人工智能社区和更广泛的世界感到惊讶,这对研究、行业动态和地缘政治都有影响。”

报告称,OpenAI的GPT-4在发布8个月后仍然是最强大的大型语言模型,“在经典基准测试和旨在评估人类的考试上都击败了所有其他LLM。”然而,随着尖端人工智能系统变得更加强大和灵活,比较它们的能力越来越困难。由于基准变得不那么明确,用于评估大语言模型的“基于氛围”的方法在业界越来越普遍。

报告指出,开发者越来越努力地尝试通过更小的模型、更好的数据集和更长的上下文来克隆或超越性能。由于人们担心人类生成的数据只能再维持人工智能训练几年,因此这些问题可能会变得更加紧迫。

此外,大型语言模型和扩散模型继续推动现实世界的突破,特别是在生命科学领域,在分子生物学和药物发现方面取得了有意义的进步。

报告称,计算是新的石油,先进GPU(图形处理器)制造商英伟达创下了前所未有的盈利纪录,初创公司则利用GPU作为竞争优势。随着美国收紧对中国的贸易限制,并在芯片大战中动员其盟国,芯片制造商英伟达、英特尔和AMD的出口受到影响。

同时,生成式AI拯救了风险投资界,在科技业估值下滑的情况下,人工智能初创公司专注于生成式AI应用(包括视频、文本和编码),从风险投资和企业投资者那里筹集了超过180亿美元。

还看不到100%克隆GPT-4的办法

报告称,虽然去年开源工作似乎在AI领域处于领先,但大型科技公司在2023年主导了该行业。在强大的计算机芯片持续短缺的情况下,随着训练大型人工智能模型所需的成本不断增加,最大的科技公司从现有的计算基础设施和庞大的资本储备中获得了优势。

“去年,我们看到很多人聚集在Discord服务器上,看到了很多开源模型,但大型科技公司似乎并没有做那么多事情。”贝纳什在接受《时代》采访时说, “今年,这看起来像是一个相当重大的逆转,几乎所有上市科技公司都在采取行动开发人工智能系统或将其集成到它们的产品中。开源世界仍然非常活跃,并且正在迅速追赶闭源功能,但还看不到100%克隆GPT-4的办法。”

报告称,人工智能公司公开分享其最先进研究的文化在2023年终结。OpenAI拒绝分享有关GPT-4系统架构的“任何有用信息”,谷歌和初创公司Anthropic对其模型也做出了类似的决定。报告称:“随着经济风险和安全担忧越来越高(你可以选择相信什么),传统上开放的公司已经接受了对其最前沿研究不透明的文化。”

报告称,人工智能安全“摆脱了人工智能研究界不受欢迎的‘表亲’地位,并在2023年首次占据了舞台中心”。然而,一系列活动掩盖了人工智能界内部的深刻分歧,全球治理缺乏具体进展,世界各国政府采取的做法相互矛盾。由于全球对监管的前进方向缺乏共识,尖端人工智能系统的开发者正在通过提出自己的监管模型来“推动规范的形成”。

“世界各地的政府和监管机构开始引起注意。这变得更具挑战性,因为许多正在讨论的全球治理模式都需要目前陷入芯片战争的长期地缘政治对手进行合作。”新闻稿写道。

对2024年的预测

除了大型语言模型,该报告还深入探讨了AI其他领域的进展,从导航和天气预报的突破到自动驾驶汽车和音乐生成。

与每年一样,该报告对未来一年做出了一些预测。去年的9项预测中有5项是准确的,包括对人工智能投资规模的估计。对2024年的预测包括:

·一个好莱坞级别的作品利用生成式人工智能来实现视觉效果。

·一家生成式AI媒体公司因在2024年美国大选期间违法而受到调查。

·生成式AI扩展热潮导致一个团队花费超过10亿美元来训练单个大型模型。

·除了高层的自愿承诺之外,全球人工智能治理的进展有限。

·一首AI生成的歌曲跻身Billboard榜单前10名或Spotify 2024年热门歌曲排行榜。

·执行和解释方面的难题,意味着欧盟 《人工智能法》不能成为被广泛采用的人工智能监管模式。

参考资料:https://www.stateof.ai/2023-report-launch

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
NeurIPS 2025放榜:阿里Qwen门控注意力获最佳论文
嘻疯 发自 凹非寺量子位 | 公众号 QbitAI刚刚,NeurIPS 2025最佳论文奖、..
阿里千问开源4款Qwen3.5小尺寸模型,满足资源受限至轻量应用不同需求..
【太平洋科技快讯】3月3日消息,阿里千问近日开源四款Qwen3.5更小尺寸模..
实测Qwen3.6-27B:4分钟做了个跑酷游戏,验证码识别正确率超90%..
它用时四分钟左右,写完了1200多行代码。从实测结果来看,游戏设计与前端..
阿里亲身入局具身智能!Qwen内部组团,通义千问技术负责人带队..
衡宇 发自 凹非寺量子位 | 公众号 QbitAIQwen团队内部组建了一个全新的具..
Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus..
衡宇 发自 凹非寺量子位 | 公众号 QbitAI三天不开源,Qwen团队手就痒。昨..
Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒
全球最快的开源大模型来了——速度达到了每秒2000个tokens!虽然只有320..
激活170亿参数 Qwen3.5实测 重构大模型性价比逻辑
2月16日Qwen3.5正式开源,以3970亿总参数、仅170亿激活参数的架构实现性..
Qwen最新闭源模型曝光!实测夸克“对话助手”
10月23日,阿里旗下夸克正式上线“对话助手”。从界面上看,它像是“塞进..
林俊旸离职后,Qwen的变与不变
来源:视觉中国OpenAI早期也曾采用垂直整合的架构模式,并集中资源完成了..
关于作者
卿嫣(普通会员)
文章
1937
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106516

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索